B

BPO

由 THUDM 开发
BPO是一种无需训练大语言模型的黑盒对齐技术,通过优化用户输入提示来改进模型输出质量。
下载量 155
发布时间 : 11/20/2023
模型介绍
内容详情
替代品

模型简介

BPO是一种区别于传统训练方法的黑盒对齐技术,仅需训练即插即用模型来优化用户输入,适用于各类开源或基于API的大语言模型。

模型特点

无需模型训练
仅通过优化用户输入提示即可改进大语言模型输出,无需对基础模型进行训练
广泛适用性
可应用于各类开源或基于API的大语言模型,包括GPT-3.5、Claude-2等
性能提升显著
实验显示在多个模型上能显著提高输出质量,胜率普遍超过50%

模型能力

提示优化
大语言模型对齐
文本生成改进

使用案例

大语言模型应用
GPT-3.5输出优化
使用BPO优化GPT-3.5的输入提示,获得更优质的输出
相比原始GPT-3.5,优化后胜率达60%
Claude-2输出改进
通过BPO优化Claude-2的输入提示
优化后胜率达57.5%