P

Ptt5 Base Portuguese Vocab

由 unicamp-dl 开发
PTT5是基于BrWac语料库预训练的T5模型,专为葡萄牙语自然语言处理任务优化,提供三种规格及两种词表选择。
下载量 4,090
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是T5架构的葡萄牙语版本,经过大规模葡萄牙语网页数据预训练,适用于文本生成、翻译等序列到序列任务。

模型特点

葡萄牙语优化
使用BrWac葡萄牙语语料库预训练,并提供了专门针对葡萄牙语优化的词表版本
多规格选择
提供小型(60M)、基础型(220M)和大型(740M)三种参数规模的模型
双词表支持
可选择谷歌原版T5词表或基于葡萄牙语维基百科训练的自定义词表

模型能力

葡萄牙语文本生成
序列到序列任务处理
文本摘要
机器翻译
问答系统

使用案例

自然语言处理
葡萄牙语文本摘要
对葡萄牙语长文本生成简洁摘要
葡萄牙语问答系统
基于葡萄牙语文本的问答应用开发
教育技术
葡萄牙语学习辅助
为学习葡萄牙语的学生提供语言生成和练习