B

Bertin Base Xnli Es

由 bertin-project 开发
基于西班牙语RoBERTa-base架构的预训练模型,针对XNLI数据集进行微调,采用高斯采样方法优化训练数据质量
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是从零开始训练的西班牙语RoBERTa-base模型,通过高斯函数采样方法筛选训练数据,特别优化了XNLI任务性能

模型特点

高斯采样训练数据
采用高斯函数对mc4数据集进行子采样,有效过滤低质量文本和重复内容
512序列长度
支持长达512个token的序列处理能力
XNLI优化
专门针对跨语言自然语言推理任务进行微调

模型能力

自然语言理解
跨语言推理
文本分类

使用案例

自然语言处理
跨语言文本推理
判断西班牙语文本之间的逻辑关系
在XNLI任务上表现优异
文本分类
对西班牙语文本进行分类任务