roberta-large-japanese开源日语模型 - 免费部署助力日语自然语言处理任务

Roberta Large Japanese

由 nlp-waseda 开发

基于日语维基百科和CC-100日语部分预训练的大型日语RoBERTa模型，适用于日语自然语言处理任务。

下载量 227

发布时间 : 5/10/2022

模型简介

这是一个基于日语维基百科和CC-100日语部分预训练的大型日语RoBERTa模型，主要用于日语文本的掩码语言建模和下游任务的微调。

日语专用预训练

专门针对日语文本进行预训练，优化了日语自然语言处理任务的性能。

Juman++分词支持

输入文本需预先使用Juman++进行分词，确保对日语文本的高效处理。

大规模训练数据

基于日语维基百科和CC-100的日语部分进行训练，覆盖广泛的日语语料。

高性能硬件训练

使用八块NVIDIA A100 GPU进行训练，耗时两周，确保模型的高质量。

日语文本理解

掩码语言建模

下游任务微调

自然语言处理

日语文本填充

使用掩码语言建模填充日语文本中的缺失部分。

下游任务微调

在特定日语NLP任务（如文本分类、命名实体识别等）上微调模型。