B

Bert Base Spanish Wwm Cased

由 dccuchile 开发
BETO是基于大型西班牙语语料库训练的BERT模型,提供区分大小写和未区分大小写版本,适用于多种西班牙语NLP任务。
下载量 61.43k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BETO是专门针对西班牙语优化的BERT模型,采用全词掩码技术训练,在词性标注、命名实体识别等任务上表现优异。

模型特点

全词掩码训练
采用Whole Word Masking技术,提升模型对西班牙语的理解能力
双版本支持
提供区分大小写和未区分大小写两种版本,适应不同应用场景
大规模训练
基于31K BPE子词词汇表,训练200万步
多框架支持
提供TensorFlow和PyTorch两种框架的预训练权重

模型能力

西班牙语文本理解
词性标注
命名实体识别
文档分类
文本复述检测
跨语言推理

使用案例

自然语言处理
西班牙语文档分类
对西班牙语新闻、文章等进行自动分类
在MLDoc数据集上达到96.12%准确率
西班牙语命名实体识别
识别西班牙语文本中的人名、地名等实体
在CoNLL-2002数据集上达到88.43% F1分数
跨语言应用
跨语言推理
处理西班牙语与其他语言间的推理任务
在XNLI数据集上达到82.01%准确率