J

Japanese Roberta Base

由 rinna 开发
由rinna株式会社训练的基础尺寸日语RoBERTa模型,适用于日语文本的掩码语言建模任务。
下载量 9,375
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于RoBERTa架构的日语预训练语言模型,主要用于日语文本的掩码词预测任务。

模型特点

日语专用预训练
专门针对日语文本进行预训练,优化了日语语言特性
基于RoBERTa架构
采用改进的BERT架构,移除下一句预测任务,使用更大的批次和更多数据进行训练
SentencePiece分词
使用基于sentencepiece的分词器,在日语维基百科上训练而成

模型能力

掩码词预测
日语文本理解
上下文语义分析

使用案例

文本补全
日语文本掩码词预测
预测被掩码的日语词汇
在示例中准确预测了'オリンピック'等词汇
语言模型微调
下游NLP任务
可作为基础模型用于各种日语NLP任务的微调