R

Rumodernbert Small

由 deepvk 开发
俄罗斯版现代化单向双向编码器Transformer模型,预训练使用了约2万亿个俄语、英语和代码数据的标记,上下文长度高达8,192个标记。
下载量 619
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

RuModernBERT是俄罗斯的现代化BERT模型,支持掩码语言模型任务,适用于俄语和英语文本处理。

模型特点

长上下文支持
支持高达8,192个标记的上下文长度,适合处理长文本。
多语言支持
预训练数据包含俄语、英语和代码数据,支持多语言任务。
高效训练
采用三阶段训练策略,使用不同质量的数据源优化模型性能。

模型能力

掩码语言模型
俄语文本处理
英语文本处理
长文本理解

使用案例

自然语言处理
文本补全
使用掩码语言模型功能补全句子中的缺失部分。
示例:'妈妈洗了[MASK]。' → '妈妈洗了碗。'
文本理解
处理和理解长文本内容。