L

Llama 3.1 Nemotron Nano 4B V1.1

由 nvidia 开发
Llama-3.1-Nemotron-Nano-4B-v1.1 是一个基于Llama 3.1压缩优化的大型语言模型,专注于推理和对话任务,支持128K上下文长度,适配单张RTX显卡。
下载量 5,714
发布时间 : 5/3/2025
模型介绍
内容详情
替代品

模型简介

该模型通过多阶段后训练流程提升推理和非推理能力,包括数学、代码、推理和工具调用的监督微调,以及对话和指令跟随的强化学习。适用于AI代理系统、聊天机器人和RAG系统等应用。

模型特点

高效推理
通过LLM压缩技术从Llama 3.1 8B压缩而来,在精度和效率之间取得平衡,适配单张RTX显卡。
长上下文支持
支持128K的上下文长度,适合处理长文档和复杂对话场景。
多阶段优化
经过监督微调和强化学习多阶段训练,提升数学、代码、推理和对话能力。
工具调用支持
支持工具调用功能,可用于构建更复杂的AI代理系统。

模型能力

文本生成
数学推理
代码生成
工具调用
多语言支持
长上下文处理

使用案例

AI代理系统
聊天机器人
构建高性能对话系统,支持复杂对话和指令跟随。
在MT-Bench上获得8.0分(推理开启模式)
RAG系统
用于检索增强生成系统,处理长文档和复杂查询。
支持128K上下文长度
代码辅助
代码生成
根据自然语言描述生成Python代码。
在MBPP 0-shot测试中pass@1达85.8%
数学推理
数学问题求解
解决复杂数学问题并展示推理过程。
在MATH500测试中pass@1达96.2%