R

Ruroberta Large Paraphrase V1

由 s-nlp 开发
基于ruRoberta-large训练的俄语句子相似度分类模型,用于判断两个句子是否为同义改写
下载量 942
发布时间 : 7/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于预测两个俄语句子的语义等价性,可判断文本对是同义改写(1)还是非同义改写(0)。适用于文本改写或风格转换中的内容保留程度评估。

模型特点

多数据集联合训练
融合了RuPAWS、ru_paraphraser和去毒数据集,覆盖多种文本改写场景
高性能语义匹配
在多个测试集上ROC AUC得分超过0.85,最高达0.906
鲁棒性架构
基于强大的ruRoberta-large模型,具备优秀的俄语语义理解能力

模型能力

俄语句子相似度计算
语义等价性判断
文本改写内容保留评估
风格转换效果验证

使用案例

文本处理
改写检测
判断两个俄语句子是否为同义改写
可准确识别语义相同的不同表达方式
内容去毒评估
评估文本去毒处理后是否保留了原意
ROC AUC达0.857
质量评估
机器翻译评估
评估不同翻译版本间的语义一致性