GPT2-large-helpful-reward开源模型 - 免费检测帮助性响应，支持RLHF训练

首页

Gpt2 Large Helpful Reward Model

由 Ray2333 开发

基于Anthropic/hh-rlhf帮助性数据集训练的GPT2大模型，专用于帮助性响应检测或RLHF（基于人类反馈的强化学习）。

大型语言模型

Transformers

开源协议:MIT #RLHF奖励模型 #帮助性响应检测 #多目标对齐

下载量 2,935

发布时间 : 1/15/2024

模型简介

该模型用于评估AI助手的响应是否具有帮助性，适用于基于人类反馈的强化学习（RLHF）场景。

模型特点

高准确率

在测试集上达到了0.72621的准确率，与更大规模的其他模型表现接近。

RLHF专用

专门为基于人类反馈的强化学习（RLHF）场景设计，特别关注响应帮助性评估。

多目标对齐

支持'无害性'和'帮助性'等多目标对齐，被用于ICML 2024的'Rewards-in-context'项目。

模型能力

帮助性响应评分

强化学习反馈生成

对话质量评估

使用案例

AI助手开发

对话系统质量评估

评估AI助手生成的响应是否对用户有帮助

提供0-1之间的帮助性评分

强化学习

RLHF训练

作为奖励模型用于基于人类反馈的强化学习

帮助优化AI助手的响应质量

属性	详情
训练数据	Anthropic/hh - rlhf

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Gpt2 Large Helpful Reward Model

模型简介

模型特点

模型能力

使用案例

🚀 GPT2大模型奖励模型

🚀 快速开始

注意事项

使用示例

📚 详细文档

数据集

评估指标

📄 许可证

📚 参考文献