P

Pd Robert

由 viswadarshan06 开发
基于RoBERTa-base微调的复述检测模型,训练数据来自MRPC、QQP、PAWS-X和PIT四大基准数据集,适用于重复内容检测、问答系统和语义相似度分析。
下载量 357
发布时间 : 2/9/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Transformer的句子对分类器,专门用于检测英语文本中的复述关系,在多样化语言结构中表现优异。

模型特点

多数据集联合训练
融合MRPC、QQP、PAWS-X和PIT四大基准数据集,覆盖新闻、问答、对抗性文本等多种场景
高鲁棒性
在PAWS-X对抗性数据集上表现优异(F1分数94.13%)
领域适应性强
支持基于领域特定数据(如医疗、法律)的进一步微调

模型能力

重复问题检测
语义相似度分析
文档去重
问答系统优化

使用案例

客户服务
FAQ重复问题识别
自动识别用户提问中的语义重复问题
减少人工审核工作量
内容审核
抄袭检测
识别改述的抄袭内容
准确率超过90%