I

It5 Small

由 gsarti 开发
IT5是首个针对意大利语进行大规模序列到序列Transformer模型预训练的模型家族,遵循原始T5模型的方法。
下载量 220
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对意大利语的序列到序列Transformer模型,主要用于文本理解和生成任务,需要在下游任务上进行微调才能使用。

模型特点

意大利语优化
专门针对意大利语进行大规模预训练,优化了意大利语文本处理能力
基于T5架构
采用改进的T5-v1.1小型架构,使用门控gelu激活函数
大规模训练数据
使用清理过的意大利语mC4语料库(约410亿词)进行训练

模型能力

意大利语文本理解
意大利语文本生成
序列到序列任务处理

使用案例

自然语言处理
问答系统
可用于构建意大利语问答系统
需要在下游任务上微调
文本摘要
可用于意大利语文本摘要任务
需要在下游任务上微调