L

Llama 3.1 Nemotron Nano 4B V1.1

由 unsloth 开发
Llama-3.1-Nemotron-Nano-4B-v1.1 是一个基于Llama 3.1 8B压缩而来的大型语言模型,优化了推理能力和任务执行效率,适用于单块RTX显卡本地运行。
下载量 219
发布时间 : 5/21/2025
模型介绍
内容详情
替代品

模型简介

该模型通过多阶段后训练流程增强其推理和非推理能力,包括数学、代码、推理和工具调用的监督微调,以及对话和指令跟随的强化学习。

模型特点

高效推理
通过LLM压缩技术优化,适配单块RTX显卡,支持本地运行。
多阶段训练
结合监督微调(SFT)和强化学习(RL)提升模型在数学、代码、推理和对话任务中的表现。
长上下文支持
支持最高131,072个标记的上下文长度,适合处理长文本任务。
工具调用支持
内置工具调用解析器,支持动态工具选择和执行。

模型能力

文本生成
数学推理
代码生成
工具调用
多语言支持
指令跟随

使用案例

AI代理系统
聊天机器人
用于构建高效的对话系统,支持自然语言交互。
在MT-Bench基准测试中得分8.0(推理开启模式)。
RAG系统
支持检索增强生成任务,适用于知识密集型应用。
教育
数学问题求解
解决复杂的数学问题,如方程求解和证明。
在MATH500基准测试中pass@1达96.2%(推理开启模式)。
开发工具
代码生成
根据自然语言描述生成可执行的Python代码。
在MBPP 0-shot基准测试中pass@1达85.8%(推理开启模式)。