X

XLMR MaCoCu Is

由 MaCoCu 开发
XLMR-MaCoCu-is是基于冰岛语文本大规模预训练的语言模型,通过继续训练XLM-RoBERTa-large模型构建,隶属于MaCoCu项目。
下载量 27
发布时间 : 8/11/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于冰岛语的自然语言处理任务,如词性标注、命名实体识别和常识推理等。

模型特点

大规模冰岛语预训练
使用4.4GB冰岛语文本(6.88亿词元)进行训练,专注于冰岛语的自然语言处理任务。
多任务性能优越
在UPOS、XPOS、NER和COPA等多个基准测试中表现优于同类模型。
基于XLM-RoBERTa-large
继承了XLM-RoBERTa-large的强大架构和词汇表,针对冰岛语进行了优化。

模型能力

词性标注
命名实体识别
常识推理
文本理解

使用案例

语言学分析
词性标注
对冰岛语文本进行词性标注
在UPOS测试集上达到97.0的准确率
命名实体识别
识别冰岛语文本中的命名实体
在NER测试集上达到93.2的F1分数
常识推理
COPA任务
完成冰岛语的常识推理任务
在COPA测试集上达到59.6的准确率