P

Prometheus Vision 13b V1.0

由 prometheus-eval 开发
首个专为评估任务开发的开源视觉语言模型,与GPT-4V和人类评估者均展现出高度相关性
下载量 121
发布时间 : 1/14/2024
模型介绍
内容详情
替代品

模型简介

普罗米修斯视觉是一个视觉语言模型,专门设计用于评估任务,能够根据图像、指令、待评估回答、评分标准和参考答案生成语言反馈和分数判定。

模型特点

多组件评估能力
能够处理图像、指令、待评估回答、评分标准和参考答案五个输入组件,生成详细反馈和评分
与GPT-4V高度相关
评估结果与GPT-4V和人类评估者展现出高度相关性,具备替代GPT-4V评估的潜力
细粒度评分
提供1-5分的细粒度评分,并附带详细的评估反馈

模型能力

图像理解
文本生成
视觉问答
回答评估
反馈生成

使用案例

教育评估
视觉问答系统评估
评估视觉问答系统的回答质量
提供与人类评估高度一致的评分和反馈
内容审核
图像内容合规性评估
评估图像相关内容的合规性和适当性
生成详细的合规性评估报告