B

Bertin Base Gaussian

由 bertin-project 开发
这是一个基于RoBERTa-base架构、从零开始训练的西班牙语填充掩码模型。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对西班牙语设计,用于填充掩码任务,能够预测文本中缺失的单词或短语。

模型特点

高质量训练数据
训练数据集来自mc4的抽样文档,总计约5000万条样本,采用高斯函数偏向平均困惑值进行筛选,确保数据质量。
从零开始训练
模型并非基于预训练模型微调,而是从零开始训练,专门针对西班牙语优化。
社区支持
该项目隶属于Jax/Flax社区周活动,由HuggingFace组织,并获Google提供的TPU算力支持。

模型能力

西班牙语文本理解
填充掩码预测

使用案例

文本补全
句子补全
预测句子中缺失的单词或短语,如示例中的'Fui a la librería a comprar un <mask>.'
语言教育
西班牙语学习辅助
可用于西班牙语学习工具,帮助学习者理解句子结构和词汇用法。