I

It5 Base

由 gsarti 开发
IT5是首个针对意大利语进行大规模序列到序列Transformer模型预训练的尝试,基于T5模型架构。
下载量 389
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是意大利语文本到文本转换模型的基础版本,主要用于意大利语的理解和生成任务,需要在下游任务上进行微调才能使用。

模型特点

意大利语专用预训练
首个专门针对意大利语进行大规模预训练的序列到序列Transformer模型
基于改进版T5架构
采用google/t5-v1_1-base改进配置,使用门控GELU激活函数
大规模训练数据
在清理过的意大利语mC4语料库(约410亿词)上训练
多框架支持
提供PyTorch、Flax和TensorFlow三种实现版本

模型能力

意大利语文本理解
意大利语文本生成
序列到序列转换

使用案例

文本生成
新闻摘要
对意大利语新闻文章进行自动摘要
需要微调后使用
文本转换
语言改写
意大利语文本的改写和简化
需要微调后使用