L

Llama 3.3 Nemotron 70B Select

由 nvidia 开发
基于Meta-Llama-3.3-70B-Instruct构建的大型语言模型,用于选择对用户查询最有帮助的LLM生成响应。
下载量 427
发布时间 : 3/14/2025
模型介绍
内容详情
替代品

模型简介

该模型通过扩展的Bradley-Terry建模进行微调,专门用于评估和选择对用户查询最有帮助的LLM生成响应,适用于希望通过推理时间扩展提升通用开放任务性能的用户。

模型特点

商业用途准备就绪
该模型已准备好用于商业用途,受NVIDIA开放模型许可证约束。
高性能响应选择
通过扩展的Bradley-Terry建模进行微调,能够准确评估和选择最有帮助的LLM生成响应。
反馈-编辑推理时间扩展系统
作为反馈-编辑推理时间扩展系统的一部分,与Feedback和Edit模型协同工作,提供更优的推理性能。
大上下文窗口
支持最多128k个token的输入,适合处理长文本内容。

模型能力

响应质量评估
文本理解
长文本处理

使用案例

AI辅助决策
多响应质量排序
对同一用户查询的多个LLM生成响应进行质量评估和排序
输出浮点值表示响应质量,数值越高表示质量越高
AI系统优化
推理时间扩展系统
作为反馈-编辑推理时间扩展系统的一部分,提升整体系统性能
在Arena Hard排行榜上表现优异