B

Bertin Roberta Base Spanish

由 bertin-project 开发
BERTIN是一系列基于BERT的西班牙语模型,当前模型是在西班牙语mC4部分上使用Flax从头训练的RoBERTa-base模型。
下载量 1,845
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BERTIN是一个高效的西班牙语预训练语言模型,使用困惑度采样技术优化训练过程,适用于填充掩码等自然语言处理任务。

模型特点

困惑度采样技术
使用创新的困惑度采样方法,显著减少训练数据量和训练时间,同时保持模型性能。
高效预训练
在Flax/JAX社区活动期间完成训练,展示了小型团队高效训练大型语言模型的可能性。
西班牙语优化
专门针对西班牙语设计和优化,填补了西班牙语单语模型的空白。

模型能力

文本理解
填充掩码
西班牙语自然语言处理

使用案例

文本处理
文本补全
自动补全句子中缺失的部分,如'我去书店买了一本<mask>'。
语言研究
西班牙语语言模型研究
为西班牙语NLP研究提供基础模型。