I

It5 Base Oscar

由 gsarti 开发
首个针对意大利语进行大规模序列到序列Transformer模型预训练的项目,基于OSCAR语料库训练
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是IT5模型家族的基础版本,专门针对意大利语进行预训练,采用T5架构,适用于各种序列到序列任务。

模型特点

意大利语专用预训练
首个针对意大利语进行大规模预训练的序列到序列Transformer模型
基于OSCAR语料库
使用OSCAR语料库的意大利语部分进行训练
改进版分词器
采用在mC4意大利语部分训练的SentencePieceUnigramTokenizer
TPU优化训练
在Google Cloud的TPU3v8-VM机器上完成训练,由Google TPU研究云赞助

模型能力

意大利语文本理解
意大利语文本生成
序列到序列转换

使用案例

自然语言处理
自然语言推理
可用于自然语言推理任务,如前提-假设关系判断
参见微调模型gsarti/it5-base-nli
文本摘要
可用于意大利语文本的自动摘要生成
机器翻译
可用于意大利语相关的翻译任务