I

Icebert Xlmr Ic3

由 mideind 开发
基于RoBERTa-base架构的冰岛语掩码语言模型,通过xlm-roberta-base微调训练而成
下载量 24
发布时间 : 3/17/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对冰岛语优化的掩码语言模型,主要用于冰岛语文本的填充和预测任务。基于RoBERTa架构,通过大规模冰岛语语料库训练。

模型特点

冰岛语优化
专门针对冰岛语训练,在冰岛语文本处理任务上表现优异
基于XLM-RoBERTa
以xlm-roberta-base为基础进行微调,继承了其强大的多语言理解能力
大规模训练数据
使用4.9GB的冰岛Common Crawl语料库(IC3)训练,包含8.24亿词元

模型能力

文本填充
语言理解
文本预测

使用案例

自然语言处理
文本自动补全
在冰岛语文本编辑中提供智能补全建议
语言模型微调基础
可作为下游冰岛语NLP任务的预训练模型