H

Hallucination Evaluation Model

由 vectara 开发
HHEM-2.1-Open是Vectara开发的幻觉检测模型,用于评估大语言模型生成内容与给定证据的一致性。
下载量 229.46k
发布时间 : 10/25/2023
模型介绍
内容详情
替代品

模型简介

专为检测大语言模型(LLM)幻觉设计的文本分类模型,特别适用于检索增强生成(RAG)场景,量化评估生成内容与事实的一致性程度。

模型特点

高性能检测
在RAGTruth基准测试中超越GPT-3.5-Turbo和GPT-4的平衡准确率
轻量高效
32位精度下内存占用不足600MB,现代x86 CPU处理2k词元输入仅需约1.5秒
无限上下文支持
相比前代HHEM-1.0的512词元限制,支持长上下文场景
非对称检测
能识别事实正确但不符合上下文的特殊幻觉类型

模型能力

文本一致性评估
RAG场景幻觉检测
跨句子逻辑关系分析

使用案例

检索增强生成(RAG)
摘要事实核查
当LLM基于检索结果生成摘要时,验证摘要内容是否与检索证据一致
在RAGTruth-Summ基准上达到64.42%平衡准确率
问答系统验证
评估问答系统生成的答案是否严格基于提供的上下文
在RAGTruth-QA基准上达到74.28%平衡准确率
内容审核
事实性声明验证
检测用户生成内容(UGC)中与已知事实矛盾的陈述