D

Deephermes ToolCalling Specialist Atropos

由 NousResearch 开发
由Nous Research使用Atropos强化学习框架微调的实验性模型,专注于提升Llama-3.1 8B模型在推理模式下的工具调用性能
下载量 64
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

基于DeepHermes 3 Llama-3.1 8B模型,通过Atropos强化学习框架专门优化了工具调用能力,特别适合复杂推理任务中的工具使用场景

模型特点

强化学习优化的工具调用
通过Atropos强化学习框架显著提升了模型在推理模式下的工具调用准确率
开源强化学习框架
基于完全开源的Atropos强化学习环境栈开发
多模式推理支持
支持深度推理模式、标准对话/指令模式、结构化JSON输出和函数调用

模型能力

复杂推理任务处理
并行工具调用
结构化JSON输出生成
函数调用执行
指令跟随

使用案例

工具调用优化
并行函数调用
同时处理多个函数调用请求
准确率从0.10提升至0.46
简单工具调用
基础工具调用任务
准确率从0.21提升至0.5175