Dhruv-27B开源语言模型 - 免费部署助力学术、逻辑和事实评估推理

首页

Dhruv 27B

由 vicharai 开发

Dhruv-27B-preview是基于Gemma3的270亿参数语言模型，专为高级推理任务微调，适用于学术、逻辑和事实评估。

大型语言模型

Transformers

#270亿参数推理 #学术问答优化 #多语言事实推理

下载量 18

发布时间 : 3/18/2025

模型简介

Dhruv-27B-preview是一个高性能语言模型，针对推理、问答和事实正确性进行了优化，适用于研究、企业应用和通用知识理解。

模型特点

高级推理能力

针对推理任务进行了专门优化，能够进行深度上下文推理和思维链生成。

高性能基准测试

在MMLU和GPQA等基准测试中表现优异，显示出强大的知识理解和推理能力。

高效推理

支持int8量化，提高了推理效率。

模型能力

高级推理

问答任务

事实评估

多语言处理

思维链生成

使用案例

学术研究

学术问答

用于回答复杂的学术问题，提供准确的解释和分析。

在MMLU 5-shot测试中达到80.0%的准确率。

企业应用

事实核查

用于企业环境中的事实核查和信息验证。

AI代理

通用推理代理

作为需要强大知识理解的AI代理的核心组件。

🚀 Dhruv-27b-preview模型卡片

Dhruv-27b-preview是一款强大的语言模型，基于Gemma3架构，拥有270亿参数。它针对高级推理任务进行了微调，能在学术、逻辑和事实评估中展现卓越性能，适用于研究、企业应用等多种场景。

🚀 快速开始

若要在Hugging Face上使用Gemma，你需要查看并同意Google的使用许可。请确保你已登录Hugging Face，然后点击下方按钮，请求将立即处理。 [确认许可](Acknowledge license)

✨ 主要特性

强大推理能力：基于Gemma3架构，经过微调，擅长高级推理任务。
高性能表现：在关键基准测试中取得优异成绩，如MMLU（5-shot）达到80.0%，GPQA（0-shot）达到52.0%。
广泛应用场景：适用于研究、学术问答、通用推理代理、多语言事实推理以及对事实准确性和深度有高要求的企业AI工具。

📚 详细文档

模型概述

Dhruv-27B-preview是基于Gemma3的270亿参数语言模型，属于Gemini推理系列。它经过优化，在学术、逻辑和事实评估中表现出色，能够进行深度上下文推理和思维链生成，适合需要强大常识理解能力的研究、企业应用和AI代理。

关键指标

Dhruv-27b-preview在关键基准测试中表现强劲：

+------------------------+--------+
|        指标         | 得分  |
+------------------------+--------+
| MMLU (5-shot)          | 80.0%  |
| GPQA (0-shot)          | 52.0%  |
+------------------------+--------+

模型架构

属性	详情
基础模型	Gemma3
模型规模	270亿参数
模型类型	仅解码器的Transformer（因果语言模型）
精度	采用bf16和int8量化以提高推理效率
训练目标	针对推理、问答和事实正确性进行指令微调

预期用途

研究和学术问答任务
通用推理代理
多语言事实推理
对事实准确性和深度有高要求的企业AI工具

使用方法

使用系统模板

局限性

未针对创造性生成或对话任务进行优化。
在训练数据有限的领域可能会产生幻觉。
对于复杂指令，需要精细的提示工程。

引用

@misc{vicharai_dhruv27b,
  title={Dhruv-27B: Gemma3 Reasoning Model},
  author={vicharai},
  year={2025},
  publisher={vicharai},
  url={https://vichar.io}
}

由vichar ai开发 Huggingface 官网