R

Russian Text Normalizer

由 saarus72 开发
基于FRED-T5-large微调的俄语文本规范化模型,支持数字和拉丁字符的规范化处理
下载量 577
发布时间 : 1/6/2024
模型介绍
内容详情
替代品

模型简介

该模型用于将俄语文本中的数字和拉丁字符转换为规范的俄语表达形式,适用于文本预处理和自然语言处理任务

模型特点

数字规范化
将数字转换为俄语文本表达形式,支持多种数字格式
拉丁字符转写
将拉丁字符(如英文单词)转写为俄语发音近似表达
灵活输入格式
支持方括号标记和特殊标记的组合输入方式
多数据源训练
基于ficbook、librusec和pikabu等多个俄语数据集训练

模型能力

数字转俄语文本
拉丁字符转俄语发音
文本规范化处理
俄语文本预处理

使用案例

文本处理
金融文本处理
将金融文档中的数字金额转换为俄语文本表达
142 990 → сто сорок две тысячи девятьсот девяносто
产品名称转写
将产品英文名称转写为俄语发音近似表达
iphone 12 → айфон двенадцатый
电话号码处理
将电话号码数字转换为俄语表达
8 9 555 35 35 → восемь девять миллионов пятьсот пятьдесят пять тысяч тридцать пять
内容创作
小说创作辅助
帮助作家将数字和外来词自动转换为规范的俄语表达
3 сына → три сына