A

Ai Detector

由 SuperAnnotate 开发
基于RoBERTa Large微调的生成文本检测模型,用于识别AI生成内容
下载量 2,160
发布时间 : 9/25/2024

模型简介

该模型专为检测生成/合成文本而设计,对训练数据筛选、识别科学与教育领域的欺诈作弊行为具有关键意义。

模型特点

平衡训练数据
使用4.4万组均衡样本训练,包含人类文本与14种LLM生成内容
多领域覆盖
训练数据涵盖维基百科、Reddit问答和科研论文三大领域
抗过拟合设计
通过卡方检验移除关键n-gram,确保模型学习真实特征而非表面模式
良好校准性
优化损失函数与标签平滑处理,使预测置信度与实际准确率匹配

模型能力

检测AI生成文本
识别大语言模型内容
区分人类写作与机器生成

使用案例

教育领域
学术诚信检测
识别学生作业中的AI生成内容
可检测GPT-4生成文本准确率达98.5%
数据筛选
训练数据净化
过滤数据集中的合成文本
对LLaMA-Chat生成内容检测准确率98%
AIbase
智启未来,您的人工智能解决方案智库
简体中文