DeepHermes-ToolCalling-Specialist-Atropos开源模型 - 提升推理工具调用性能，免费使用！

首页

Deephermes ToolCalling Specialist Atropos

由 NousResearch 开发

由Nous Research使用Atropos强化学习框架微调的实验性模型，专注于提升Llama-3.1 8B模型在推理模式下的工具调用性能

大型语言模型

Transformers

英语#强化学习微调 #推理模式工具调用 #并行函数执行

下载量 64

发布时间 : 4/11/2025

模型简介

基于DeepHermes 3 Llama-3.1 8B模型，通过Atropos强化学习框架专门优化了工具调用能力，特别适合复杂推理任务中的工具使用场景

模型特点

强化学习优化的工具调用

通过Atropos强化学习框架显著提升了模型在推理模式下的工具调用准确率

开源强化学习框架

基于完全开源的Atropos强化学习环境栈开发

多模式推理支持

支持深度推理模式、标准对话/指令模式、结构化JSON输出和函数调用

模型能力

复杂推理任务处理

并行工具调用

结构化JSON输出生成

函数调用执行

指令跟随

使用案例

工具调用优化

并行函数调用

同时处理多个函数调用请求

准确率从0.10提升至0.46

简单工具调用

基础工具调用任务

准确率从0.21提升至0.5175

🚀 深度赫尔墨斯工具调用专家 - 阿特洛波斯强化学习

深度赫尔墨斯工具调用专家 - 阿特洛波斯强化学习模型是由Nous Research使用其创新的开源强化学习框架阿特洛波斯进行微调的实验性产物。该变体专门提升了深度赫尔墨斯3 Llama - 3.1 8B模型在推理模式下的工具调用性能。

🚀 快速开始

本模型为实验性产物，并非为广泛的通用用途而设计。若你想深入了解和使用该模型，可参考以下各部分内容。

✨ 主要特性

推理模式下工具调用能力提升：强化学习显著增强了模型在复杂推理任务中的工具使用能力。
开源强化学习框架：采用了完全开源的阿特洛波斯强化学习环境。
活跃的开源社区：欢迎在阿特洛波斯的GitHub上进行贡献。
即将推出的先进强化学习训练器：Nous Research即将推出一款最先进的开源强化学习训练器。

📚 详细文档

阿特洛波斯开源框架

阿特洛波斯是Nous Research的开源强化学习环境栈，旨在通过结构化的强化学习方法增强大语言模型（LLM）功能的各个方面。我们鼓励大家贡献和探索： 🌐 阿特洛波斯GitHub仓库

基准测试结果

在伯克利函数调用基准测试中的评估表明，与基础模型相比，该模型在推理模式下的工具调用准确率有显著提升：

基准测试	基础准确率	阿特洛波斯强化学习准确率	提升倍数
并行测试	0.10	0.46	4.6倍
简单测试	0.21	0.5175	2.5倍

这些提升得益于专门针对基于推理的工具调用能力进行的强化学习微调。

评估集准确率结果：

image/png

使用方法

本模型支持多种推理模式，包括：

推理（深度思考模式）
标准聊天/指令模式
结构化JSON输出
函数调用

详细文档和示例推理代码可参考：

⚠️ 重要提示

你必须先放置深度赫尔墨斯的推理系统提示，然后再追加函数调用系统提示，这样模型才能同时进行推理和工具调用。

🌐 赫尔墨斯函数调用GitHub

📄 许可证

本模型使用llama3许可证。

🔖 引用方式

@misc{
      title={DeepHermes Tool Calling Specialist - Atropos RL},
      author={Teknium and Dakota Mahan and Roger Jin and Chen Guang and Jai Suphavadeeprasit and Jeffrey Quesnelle},
      year={2025},
      url={https://huggingface.co/NousResearch/DeepHermes-Tool-Calling-Specialist-Atropos-RL}
}