B

Bert Base Uncased

由 deepvk 开发
预训练的双向编码器,适用于俄语文本处理,基于大规模社交数据和维基百科训练
下载量 465
发布时间 : 2/7/2023
模型介绍
内容详情
替代品

模型简介

基于BERT架构的俄语预训练模型,专注于文本特征提取任务,未包含预训练头部模块

模型特点

俄语优化
基于250GB俄语语料训练,包含维基百科和社交数据
纯编码器架构
仅包含编码器部分,适合下游任务微调
严格数据过滤
训练数据经过严格质量控制

模型能力

俄语文本特征提取
上下文语义编码
下游任务微调基础

使用案例

自然语言处理
文本分类
俄语新闻分类/情感分析
在Russian Super Glue的RCB任务达到0.467准确率
问答系统
俄语阅读理解任务
在DaNetQA任务达到0.737准确率