L

Llama 3 1 Nemotron Ultra 253B V1

由 nvidia 开发
基于Meta Llama-3.1-405B-Instruct衍生的大型语言模型,通过神经架构搜索技术优化,支持128K tokens上下文长度,适用于推理、对话和指令跟随任务。
下载量 21.78k
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

Llama-3.1-Nemotron-Ultra-253B-v1是NVIDIA开发的大型语言模型,专为高效推理和复杂任务设计,支持多语言和长上下文处理。

模型特点

高效推理优化
通过神经架构搜索(NAS)技术优化模型结构,显著降低内存占用,提升推理效率。
长上下文支持
支持最长131,072 tokens的上下文处理能力,适合处理复杂任务。
多阶段训练
经过监督微调和强化学习多阶段训练,优化数学、编程、推理和对话能力。
推理模式控制
支持通过系统提示词开启/关闭详细推理模式,适应不同应用场景需求。

模型能力

文本生成
数学推理
编程辅助
多语言处理
指令跟随
工具调用
RAG系统支持

使用案例

AI智能体系统
聊天机器人
构建高性能对话系统,支持复杂交互和多轮对话。
在对话任务中表现优异
RAG系统
支持基于检索的生成任务,处理长文档和复杂查询。
支持128K tokens上下文
专业领域应用
医学问答
回答专业医学问题,支持诊断辅助。
GPQA测试通过率76.01%
数学竞赛
解决复杂数学问题,支持逐步推理。
AIME25测试通过率72.50%