S

Sage M2m100 1.2B

由 ai-forever 开发
基于M2M100-1.2B模型训练的俄语拼写检查器,用于纠正拼写错误和打字错误
下载量 184
发布时间 : 3/11/2024
模型介绍
内容详情
替代品

模型简介

该模型通过将文本中的所有单词规范为俄语标准来纠正拼写错误和打字错误。训练语料库采用了包含'人工'错误的广泛数据集,基于俄语维基百科和俄语视频转录构建。

模型特点

多领域适用
在多个不同领域的俄语数据集上表现良好,包括社交媒体、医疗和技术文本
高精度纠正
在RUSpellRU数据集上达到88.8%的精确率和71.5%的召回率
基于大模型
基于1.2B参数的M2M100模型微调,具有较强的语言理解能力

模型能力

俄语拼写检查
打字错误纠正
文本规范化

使用案例

文本处理
社交媒体文本纠正
纠正社交媒体中的非标准拼写和打字错误
在RUSpellRU数据集上F1值达79.2
医疗文本标准化
纠正医疗病史中的专业术语拼写错误
在MedSpellchecker数据集上F1值达74.9
技术文档处理
代码注释纠错
纠正GitHub代码提交中的拼写错误
在GitHubTypoCorpusRu数据集上F1值达44.9