L

Llama 3.1 Nemotron 70B Instruct HF

由 nvidia 开发
英伟达定制的大型语言模型,旨在提升大语言模型生成回复对用户查询的有用性。
下载量 29.98k
发布时间 : 10/12/2024
模型介绍
内容详情
替代品

模型简介

基于Llama-3.1-70B-Instruct的强化学习调优模型,专注于提升指令遵循能力和回复有用性。

模型特点

强化学习调优
使用REINFORCE算法和HelpSteer2-Preference数据集进行强化学习调优
高性能基准测试
在Arena Hard、AlpacaEval 2 LC和MT Bench等基准测试中表现优异
复杂指令理解
能够理解并正确回答需要多步推理的复杂问题

模型能力

文本生成
指令遵循
复杂推理
多轮对话

使用案例

智能助手
问答系统
回答用户各种问题,包括需要多步推理的复杂问题
在Arena Hard测试中获得85.0分
内容生成
详细内容创作
生成详细、连贯的长篇内容
平均回复长度达2199.8字符