G

Gpt2 Open Instruct V1 Anthropic Hh Rlhf

由 jtatman 开发
基于GPT2-open-instruct在Anthropic/hh-rlhf数据集上微调的对话模型,擅长响应对话场景中的提示
下载量 125
发布时间 : 7/22/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于vicgalle/gpt2-open-instruct-v1在Anthropic/hh-rlhf数据集子集上微调的版本,主要用于对话场景中的指令响应

模型特点

对话场景优化
专门针对'Human:'和'Assistant:'对话格式进行优化
短文本生成优势
在短文本回复场景中表现更佳
RLHF适配
通过部分RLHF适配器重构了语言模型头部

模型能力

对话生成
指令响应
短文本生成

使用案例

对话系统
对话响应生成
根据用户输入生成对话响应
在评估集上取得2.1534的损失值