X

Xlm Mlm 100 1280

由 FacebookAI 开发
XLM模型是基于100种语言的维基百科文本训练的跨语言语言模型,使用掩码语言建模目标进行预训练。
下载量 296
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Transformer架构的多语言语言模型,支持100种语言,主要用于跨语言理解和生成任务。

模型特点

多语言支持
支持100种语言的跨语言理解和生成任务
大规模预训练
基于100种语言的维基百科文本进行预训练
Transformer架构
采用16层Transformer架构,具有1280个隐藏状态和16个注意力头

模型能力

跨语言文本理解
掩码语言建模
多语言文本生成

使用案例

跨语言分类
XNLI跨语言分类
在XNLI数据集上进行跨语言自然语言推理任务
英语83.7%准确率,中文71.7%准确率等
语言理解
多语言文本理解
理解100种语言的文本内容