L

Llama 3.1 Nemotron Nano 8B V1 GGUF

由 unsloth 开发
Llama-3.1-Nemotron-Nano-8B-v1是基于Meta Llama-3.1-8B-Instruct的推理模型,经过后训练增强推理能力、人类聊天偏好及任务执行能力。
下载量 22.18k
发布时间 : 5/11/2025
模型介绍
内容详情
替代品

模型简介

这是一个大型语言模型(LLM),在模型准确性和效率之间提供良好平衡,支持128K上下文长度,适用于英语和编程语言。

模型特点

增强推理能力
经过多阶段后训练过程,包括监督微调和强化学习,显著提升数学、代码和推理能力
高效推理
可在单个RTX GPU上运行,适合本地部署,平衡计算效率与模型准确性
长上下文支持
支持128K标记的上下文长度,适合处理长文档和复杂任务
双模式推理
支持'推理开启'和'推理关闭'两种模式,适应不同场景需求

模型能力

文本生成
数学推理
代码生成
指令跟随
聊天对话
工具调用
RAG系统支持

使用案例

AI代理系统
智能聊天机器人
构建能够理解复杂指令并进行自然对话的AI助手
在MT-Bench上获得8.1分(推理开启模式)
教育
数学问题解答
解决复杂数学问题并提供分步解释
在MATH500上达到95.4% pass@1(推理开启模式)
软件开发
代码生成与辅助
根据描述生成功能代码或帮助调试
在MBPP 0-shot测试中达到84.6% pass@1