B

Bert Base Spanish Wwm Uncased

由 dccuchile 开发
BETO是基于大型西班牙语语料库训练的BERT模型,支持区分大小写和未区分大小写两种版本,适用于多种西班牙语NLP任务。
下载量 231.26k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BETO是一个专门针对西班牙语优化的BERT模型,采用全词掩码技术训练,适用于词性标注、命名实体识别、文档分类等任务。

模型特点

全词掩码训练
采用全词掩码技术训练,提高了模型对西班牙语的理解能力
双版本支持
提供区分大小写和未区分大小写两种版本,适应不同应用场景
大规模训练
基于31K BPE子词单元,训练步数达200万次

模型能力

西班牙语文本理解
词性标注
命名实体识别
文档分类
复述识别
自然语言推理

使用案例

自然语言处理
西班牙语文档分类
对西班牙语文档进行自动分类
在MLDoc数据集上达到96.12%准确率
西班牙语命名实体识别
识别西班牙语文本中的人名、地名等实体
在CoNLL-2002数据集上达到88.43% F1分数