L

Longformer Base Plagiarism Detection

由 jpwahle 开发
该模型使用Longformer架构训练,专门用于检测机器改写的抄袭文本,在学术诚信维护中具有重要应用价值。
下载量 59.47k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于Longformer-base-4096预训练模型微调的抄袭检测系统,可识别通过SpinBot等工具改写的学术文本,平均F1值达80.99%。

模型特点

长文档处理能力
采用滑动窗口注意力机制,可有效处理长达4096个token的学术文档
多改写工具识别
针对SpinBot和SpinnerChief等主流改写工具优化检测效果
学术场景优化
在论文预印本、学位论文等学术文本上表现优异(F1最高达99.68%)

模型能力

机器改写文本识别
学术抄袭检测
长文本语义分析

使用案例

学术诚信维护
论文抄袭检测
识别学生论文中使用改写工具伪装的抄袭内容
对SpinBot改写文本检测F1值达99.68%
出版审查辅助
辅助期刊编辑检测投稿论文的潜在抄袭行为
相比传统文本匹配系统(如Turnitin)效果更优
教育质量保障
作业原创性检查
自动筛查学生作业中的机器改写内容
人工评估一致性达78.4%