P

Pal B Large Opt 350m

由 daiweichen 开发
该模型是一个用于多元化对齐的个性化奖励模型,基于facebook/opt-350m训练,用于文本摘要任务。
下载量 37
发布时间 : 2/28/2025

模型简介

PAL-B-Large-opt-350m是一个多元化对齐的个性化奖励模型,专注于处理人类偏好的多样性。它采用模块化设计,能够高效地对新用户的偏好进行少样本定位,适用于文本摘要等任务。

模型特点

多元化对齐
模型能够处理多样化的用户偏好,而不仅仅是假设所有用户共享同质偏好。
模块化设计
利用用户间的共性同时满足个体个性化需求,能够高效地对新用户的偏好进行少样本定位。
高效性能
在Reddit TL;DR摘要任务中,对已知用户的准确率比之前最佳方法高1.7%,对未知用户高36%,且参数数量少100倍。

模型能力

文本摘要
个性化奖励建模
少样本学习

使用案例

文本处理
Reddit TL;DR摘要
为Reddit帖子生成简洁的摘要,同时考虑不同用户的偏好。
对已知用户的准确率比之前最佳方法高1.7%,对未知用户高36%。
AIbase
智启未来,您的人工智能解决方案智库
简体中文