P

Prometheus 13b V1.0

由 prometheus-eval 开发
普罗米修斯是基于Llama-2-Chat微调的评估型语言模型,擅长根据定制标准评估文本质量,可作为GPT-4评估的经济替代方案。
下载量 1,726
发布时间 : 10/12/2023
模型介绍
内容详情
替代品

模型简介

该模型经过10万条反馈数据微调,能根据参考答案和评分标准对文本回答进行细粒度评估,性能接近GPT-4。同时可作为RLHF的奖励模型。

模型特点

细粒度评估能力
通过参考答案和定制评分标准实现比通用模型更精确的文本评估
经济高效替代方案
评估性能超越GPT-3.5-Turbo,与GPT-4持平但成本更低
多标准适应性
支持儿童可读性、文化敏感性、创造力等定制化评估标准

模型能力

文本质量评估
反馈生成
奖励建模
多维度评分

使用案例

模型评估
大语言模型输出评估
根据特定标准评估不同LLM生成文本的质量
在多项基准测试中与GPT-4评估结果高度一致
强化学习
RLHF奖励模型
为人类反馈强化学习提供自动化的奖励信号