R

Rum2m100 1.2B

由 ai-forever 开发
基于M2M100-1.2B训练的俄语拼写检查模型,能纠正拼写错误和打字错误
下载量 407
发布时间 : 7/26/2023
模型介绍
内容详情
替代品

模型简介

该模型通过将文本中的所有单词规范化为俄语标准形式来纠正拼写错误和打字错误,基于包含人工错误的广泛数据集训练

模型特点

高质量拼写纠正
在多个测试数据集上表现优于ChatGPT系列模型和开源拼写检查器
多领域适用
在普通文本、医学文本、技术文本等多种领域都有良好表现
基于合成错误训练
使用SAGE库自动生成训练数据中的错误,覆盖广泛的错误类型

模型能力

俄语拼写检查
打字错误纠正
文本规范化

使用案例

文本处理
社交媒体文本纠正
纠正社交媒体中的拼写错误和打字错误
在RUSpellRU数据集上F1分数50.1
医学文本处理
纠正医学病史中的专业术语拼写错误
在MedSpellChecker数据集上F1分数60.6
技术文档处理
纠正技术文档和代码注释中的拼写错误
在GitHubTypoCorpusRu数据集上F1分数43.5