L

Llama 3.1 Nemotron Nano 8B V1

由 nvidia 开发
基于Meta Llama-3.1-8B-Instruct优化的推理与对话模型,支持128K上下文长度,平衡效率与性能
下载量 60.52k
发布时间 : 3/16/2025
模型介绍
内容详情
替代品

模型简介

专注于推理能力、人类对话偏好及任务执行(如RAG和工具调用)的大型语言模型,支持单卡RTX GPU本地部署

模型特点

双模式推理
支持推理ON/OFF模式切换,ON模式提供逐步思考过程,OFF模式直接输出结果
长上下文支持
支持长达128K tokens的上下文窗口,适合处理复杂文档和长对话
高效部署
优化后可在RTX系列消费级GPU上单卡运行,降低部署门槛
强化学习优化
通过多轮强化学习(RLOO/RPO)优化人类偏好对齐和任务执行能力

模型能力

数学推理
代码生成
工具调用
多轮对话
多语言支持
RAG系统集成

使用案例

智能助手
数学问题求解
解决复杂数学方程和证明题
MATH500测试集达到95.4%准确率
编程辅助
生成和调试Python代码
MBPP零样本测试84.6%通过率
企业应用
文档分析
处理长文档和合同文本分析
支持128K上下文长度
知识问答系统
构建基于RAG的专业领域问答系统
BFCL v2测试63.9%得分