R

Roberta Small Japanese Aozora

由 KoichiYasuoka 开发
基于青空文库文本预训练的日语RoBERTa小型模型,适用于多种下游NLP任务
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于日本青空文库文本、使用日语-LUW-分词器预训练的RoBERTa模型,可用于填充掩码任务及下游任务微调

模型特点

青空文库预训练
使用日本青空文库的文本数据进行预训练,适合处理文学类日语文本
日语-LUW分词器
采用专门针对日语优化的LUW(语言单位词)分词器,提高日语处理效果
小型模型
small版本适合资源有限的环境部署和使用

模型能力

填充掩码预测
日语文本理解
下游任务微调

使用案例

自然语言处理
词性标注
可用于日语词性标注任务
参考作者提供的POS标注模型
依存句法分析
可用于日语依存句法分析任务
文本补全
预测文本中被掩码的词语
如示例所示可预测日本旅游推荐地点