T

T5 Base Japanese

由 sonoisa 开发
基于日语语料库预训练的T5(文本到文本转换Transformer)模型,适用于多种文本生成任务。
下载量 13.85k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于日语语料库预训练的T5模型,主要用于文本到文本生成任务。模型经过大规模日语语料库训练,支持多种下游任务的微调。

模型特点

高效性能
与多语言T5模型相比,体积缩小25%,准确率高出约6个百分点。
大规模预训练
使用了约100GB的日语语料库进行预训练,包括维基百科、OSCAR和CC-100。
多任务支持
通过微调可支持多种文本生成任务,如分类、问答等。

模型能力

文本生成
文本分类
问答系统

使用案例

新闻分类
livedoor新闻分类
使用livedoor新闻语料库进行新闻文章类型预测任务。
准确率达到97%,F1分数为0.97。
问答系统
JSQuAD问答任务
在JGLUE基准测试中的JSQuAD任务上表现优异。
EM=0.900, F1=0.945。