R

Rumodernbert Base

由 deepvk 开发
现代双向仅编码器Transformer模型的俄语版本,基于约2万亿俄语、英语和代码标记进行预训练,上下文长度达8,192个标记。
下载量 2,992
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

RuModernBERT是ModernBERT的俄语版本,专注于掩码语言模型任务,支持俄语和英语。

模型特点

长上下文支持
支持长达8,192个标记的上下文长度
多语言预训练
基于俄语、英语和代码标记进行预训练
高效训练
采用三阶段训练策略,包括大规模预训练、上下文扩展和冷却阶段

模型能力

掩码语言模型
俄语文本理解
英语文本理解

使用案例

自然语言处理
文本补全
预测被掩码的单词或短语
在掩码预测任务中表现良好
文本分类
可用于情感分析等文本分类任务
在Russian Super Glue基准测试中表现优异