P

Phi3 Hallucination Judge Merge

由 grounded-ai 开发
该模型用于检测语言模型输出中的幻觉现象,即响应连贯但事实错误或脱离上下文的情况。
下载量 63
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

一个专门用于检测语言模型输出幻觉的二分类模型,通过微调实现高性能的幻觉检测能力。

模型特点

高性能幻觉检测
在幻觉检测任务中表现优异,F1分数达到0.81,超越多个前沿语言模型。
轻量级适配器
采用PEFT适配器技术,实现高效微调而不需要修改基础模型。
标准化提示策略
提供标准化的输入格式和提示策略,便于快速集成到现有系统中。

模型能力

幻觉检测
文本分类
语言模型输出评估

使用案例

语言模型质量评估
模型输出验证
验证语言模型生成内容的事实准确性
准确识别85%的幻觉输出
内容审核
事实核查
自动检测生成内容中的事实错误
召回率达到87%的错误检测