L

Llama 3 3 Nemotron Super 49B V1 GGUF

由 unsloth 开发
Llama-3.3-Nemotron-Super-49B-v1 是一个大型语言模型,基于 Meta Llama-3.3-70B-Instruct 改进,增强了推理能力、人类聊天偏好以及任务执行能力,支持 128K tokens 的上下文长度
下载量 814
发布时间 : 5/22/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个推理和聊天模型,适用于英语和编程语言,支持多种非英语语言。经过多阶段的后训练过程,增强了数学、代码、推理和工具调用能力。

模型特点

高效推理
通过神经架构搜索(NAS)优化,在精度和效率之间实现出色平衡,减少内存占用,适配单块 GPU。
多阶段后训练
经过监督微调和强化学习(RL)阶段,增强数学、代码、推理和指令跟随能力。
长上下文支持
支持 128K tokens 的上下文长度,适合处理复杂任务和大规模数据。

模型能力

文本生成
数学推理
代码生成
工具调用
多语言支持
指令跟随

使用案例

AI 代理系统
聊天机器人
用于构建高效的聊天机器人,支持多轮对话和复杂指令。
在 MT-Bench 上得分为 9.17。
RAG 系统
用于构建检索增强生成(RAG)系统,处理大规模上下文信息。
支持 128K tokens 的上下文长度。
数学与代码
数学问题求解
解决复杂的数学问题,支持逐步推理和最终答案生成。
在 MATH500 上 pass@1 为 96.6(推理开启)。
代码生成
生成高质量的代码,支持 Python 等多种编程语言。
在 MBPP 0-shot 上 pass@1 为 91.3(推理开启)。