T

T5 Base Japanese Web

由 megagonlabs 开发
基于日语网络文本预训练的T5模型,支持字节回退,32K词表规模
下载量 4,917
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对日语文本优化的T5(文本到文本转换Transformer)模型,专门用于处理日语网络文本的多种NLP任务。

模型特点

大词表支持
采用32K词表规模,能更好地处理日语文本
字节回退功能
支持字节回退,增强对未知词汇的处理能力
大规模预训练
使用mC4日语部分和日语维基百科进行预训练,覆盖广泛网络文本
TPU优化训练
在TPU v3-8上高效训练,耗时约126小时完成100万步训练

模型能力

日语文本理解
日语文本生成
文本转换任务
语言模型微调

使用案例

自然语言处理
日语文本摘要
对日语文章进行自动摘要
日语问答系统
构建基于日语的知识问答系统
日语文本分类
对日语文本进行多类别分类