P

Ptt5 Large T5 Vocab

由 unicamp-dl 开发
PTT5是基于BrWac语料库预训练的T5模型,专门针对葡萄牙语优化,提供多种尺寸和词汇表选择。
下载量 45
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

PTT5是基于BrWac语料库预训练的T5模型,旨在提升T5在葡萄牙语句子相似性和蕴含任务上的表现。模型提供三种尺寸(小型、基础和大型)及两种词汇表(谷歌原版T5词汇表和基于葡萄牙语维基百科训练的自定义词汇表)。

模型特点

葡萄牙语优化
专门针对葡萄牙语进行预训练,使用BrWac语料库和自定义葡萄牙语词汇表。
多种尺寸选择
提供小型(60M)、基础(220M)和大型(740M)三种参数规模的模型。
双词汇表支持
可选择谷歌原版T5词汇表或专门针对葡萄牙语训练的自定义词汇表。

模型能力

葡萄牙语文本生成
句子相似性计算
文本蕴含判断
文本摘要

使用案例

自然语言处理
葡萄牙语文本摘要
生成葡萄牙语文本的简洁摘要
葡萄牙语问答系统
构建基于葡萄牙语的问答系统
教育
葡萄牙语学习辅助
帮助学习葡萄牙语的学生理解文本和生成例句