L

Llama 3 OffsetBias RM 8B

由 NCSOFT 开发
基于OffsetBias数据集训练的奖励模型,针对评估模型中的偏差具有更强鲁棒性
下载量 1,782
发布时间 : 7/11/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Llama-3架构的奖励模型,专门设计用于减少评估模型时常见的各种偏差。通过融合多个高质量数据集训练而成,特别适用于需要公平评估的场景。

模型特点

偏差鲁棒性
专门针对评估模型中常见的各种偏差进行优化,提供更公平的评分
多数据集融合
结合了UltraFeedback、HelpSteer等多个高质量数据集进行训练
模型融合技术
通过中间模型与基础奖励模型的融合获得最终模型

模型能力

文本质量评估
对话响应评分
安全性评估
推理能力评估

使用案例

AI对话评估
聊天机器人响应评分
评估聊天机器人回复的质量和相关性
在RewardBench聊天评估中获得97.21分
内容安全评估
有害内容检测
识别和评分潜在有害或不适当的内容
在RewardBench安全性评估中获得89.01分