R

Ruscibert

由 ai-forever 开发
由Sber AI团队与莫斯科国立大学人工智能研究所MLSA实验室联合训练的俄语BERT模型,专注于科学文本处理
下载量 1,044
发布时间 : 12/21/2022
模型介绍
内容详情
替代品

模型简介

基于BERT架构的俄语预训练语言模型,专门针对科学文本优化,适用于掩码填充任务

模型特点

科学文本优化
专门针对俄语科学文本进行训练和优化
大规模训练数据
使用6.5GB俄语文本数据进行训练
高效分词
采用BPE算法分词器,词典规模达50265词项

模型能力

俄语文本理解
科学文本处理
掩码词预测

使用案例

自然语言处理
科学文本分类
对俄语科学文献进行分类任务
向量方法应用
使用模型生成的文本向量解决分类问题