R

Rubert Base Cased

由 DeepPavlov 开发
RuBERT是基于俄语维基百科和新闻数据训练的俄语BERT模型,具有1.8亿参数,支持掩码语言建模和下一句预测任务。
下载量 275.78k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

RuBERT是一个针对俄语优化的BERT模型,适用于各种俄语自然语言处理任务,如文本分类、命名实体识别和问答系统。

模型特点

俄语优化
专门针对俄语特性进行训练,使用俄语维基百科和新闻数据构建词汇表
多任务支持
同时支持掩码语言建模和下一句预测两种预训练任务
大规模预训练
基于1.8亿参数的大规模Transformer架构

模型能力

俄语文本理解
文本特征提取
语义相似度计算
文本分类
命名实体识别

使用案例

文本处理
俄语文本分类
对俄语新闻或文档进行分类
俄语问答系统
构建基于俄语的自动问答应用
信息提取
俄语命名实体识别
从俄语文本中提取人名、地名等实体信息