I

It5 Large

由 gsarti 开发
IT5是首个针对意大利语大规模预训练的序列到序列Transformer模型家族,遵循T5模型的方法。
下载量 37
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

IT5模型家族是专门为意大利语设计的序列到序列Transformer模型,适用于各种自然语言理解和生成任务。

模型特点

意大利语专用预训练
首个专门针对意大利语大规模预训练的序列到序列Transformer模型
改进的T5架构
基于google/t5-v1_1-large改进配置,使用门控GELU激活函数
大规模训练数据
在清理过的意大利语mC4语料库(约410亿词)上训练
多框架支持
提供PyTorch、Flax和TensorFlow版本

模型能力

意大利语文本理解
意大利语文本生成
序列到序列任务处理

使用案例

自然语言处理
意大利语文本摘要
生成意大利语文本的简洁摘要
意大利语机器翻译
支持意大利语与其他语言之间的翻译任务
意大利语问答系统
构建意大利语问答应用