M

Morphbert Large Morpheme Segmentation Ru

由 CrabInHoney 开发
基于Transformer架构的大型俄语语素分割模型,可将俄语单词的每个字符分类为25种语素类别之一
下载量 16
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

该模型专门针对俄语词语素分割任务进行微调,能够解析俄语单词的构成语素,适用于字符级别的形态分析预测。

模型特点

高精度语素分割
在评估数据集上达到约0.99的字符级准确率,能够准确识别俄语单词的语素边界。
丰富的语素类别
支持25种语素类别分类,包括词根、前缀、后缀、连接符等多种形态结构。
大型Transformer架构
采用与bert-base相当的复杂架构,比小型版本具有更高的解析准确度。

模型能力

俄语单词语素分割
字符级标记分类
形态分析预测

使用案例

语言学分析
俄语单词形态分解
将俄语单词分解为词根、前缀、后缀等语素成分
例如将'масляный'分解为'масл:ROOT / ян:SUFF / ый:END'
复合词分析
解析包含连字符的复合词结构
例如将'сине-белый'分解为'син:ROOT / е:LINK / -:HYPH / бел:ROOT1 / ый:END'
自然语言处理
俄语NLP预处理
为俄语NLP任务提供单词形态结构信息
可用于词形还原、词干提取等下游任务