D

Dialogrpt Human Vs Rand

由 microsoft 开发
DialogRPT是一个基于人类反馈数据训练的对话回应排名模型,用于预测回应与上下文的相关性。
下载量 1,021
发布时间 : 3/2/2022

模型简介

该模型是DialogRPT系列的一部分,专门用于区分给定上下文中的人类回应与随机回应,预测回应与上下文对应的可能性。

模型特点

人类反馈数据训练
基于1亿多条人类反馈数据进行训练,能够准确预测回应的相关性。
多任务支持
支持多种对话排名任务,包括人类反馈和人类相似度任务。
改进对话生成
可用于改进现有对话生成模型,通过重新排序生成的回应候选。

模型能力

对话回应排名
区分人类与随机回应
预测回应相关性

使用案例

对话系统
改进对话生成模型
通过重新排序生成的回应候选,提高对话系统的回应质量。
提高回应的相关性和人类偏好评分
对话回应筛选
从多个候选回应中选择最相关和最有意义的回应。
提升用户体验和对话流畅度
AIbase
智启未来,您的人工智能解决方案智库
简体中文