L

Llama 3 3 Nemotron Super 49B V1

由 nvidia 开发
Llama-3.3-Nemotron-Super-49B-v1是基于Meta Llama-3.3-70B-Instruct的大型语言模型,专注于推理、对话偏好和任务执行,支持128K tokens上下文长度。
下载量 150.65k
发布时间 : 3/16/2025
模型介绍
内容详情
替代品

模型简介

该模型通过神经架构搜索优化了内存占用,适合在单个GPU上高效运行,适用于AI代理系统、聊天机器人和RAG系统等应用。

模型特点

高效推理优化
通过神经架构搜索减少内存占用,提升吞吐量,适合在单个H100-80GB GPU上运行。
长上下文支持
支持128K tokens的上下文长度,适合处理复杂任务和大规模文档。
多阶段训练
结合监督微调和强化学习(RLOO/RPO),优化数学、代码、推理和对话能力。

模型能力

文本生成
数学推理
代码生成
多轮对话
指令遵循
工具调用

使用案例

企业AI应用
智能客服
构建高精度对话系统,处理复杂用户查询。
在Arena-Hard基准测试中得分88.3(推理关闭模式)。
文档分析
利用长上下文能力处理大型技术文档或法律文本。
教育
数学解题辅助
逐步解答数学问题并给出推理过程。
在MATH500基准测试中pass@1达96.6(推理开启模式)。