L

Llama 3 3 Nemotron Super 49B V1 FP8

由 nvidia 开发
Llama-3.3-Nemotron-Super-49B-v1-FP8 是一个大型语言模型,基于 Meta Llama-3.3-70B-Instruct 衍生而来,经过优化以增强推理能力、对话偏好和任务执行能力,支持 128K 令牌的上下文
下载量 81
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

该模型通过神经架构搜索(NAS)方法优化了精度和效率的平衡,适用于 AI 代理系统、聊天机器人、RAG 系统等应用。

模型特点

高效推理
通过神经架构搜索(NAS)方法优化模型结构,实现精度和效率的平衡,适合高负载环境下的单 GPU 部署。
多阶段训练
经过监督微调和强化学习(RL)阶段,增强数学、代码、推理和对话能力。
长上下文支持
支持 128K 令牌的上下文长度,适合处理复杂任务和大规模数据。

模型能力

文本生成
推理任务
代码生成
数学问题求解
多语言支持

使用案例

AI 代理系统
聊天机器人
用于构建高性能的对话系统,支持多轮对话和复杂指令。
在 IFEval 基准测试中达到 86.70 的严格指令分数。
教育
数学问题求解
用于解答复杂的数学问题,支持逐步推理和答案生成。
在 MATH500 基准测试中达到 95.6 的 pass@1 分数。
编程辅助
代码生成
生成符合描述的 Python 程序,并通过测试用例。
在 LiveCodeBench 基准测试中达到 41.22 的分数。