M

Modernbert Large Japanese Aozora

由 KoichiYasuoka 开发
这是一个基于青空文库文本预训练的ModernBERT模型,专门用于日语文本处理。
下载量 16
发布时间 : 1/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于青空文库文本预训练的ModernBERT模型,适用于日语文本的掩码语言模型任务,并可进行下游任务微调。

模型特点

基于青空文库预训练
模型使用青空文库的清洁数据集进行预训练,适用于日语文本处理。
支持下游任务微调
该模型可用于词性标注、依存句法分析等下游任务的微调。
高性能训练
使用NVIDIA A100-SXM4-40GB×8显卡训练,耗时10小时5分钟。

模型能力

日语文本处理
掩码语言模型
词性标注
依存句法分析

使用案例

自然语言处理
日语文本掩码填充
用于填充日语文本中的掩码部分,例如:'到日本后一定要去拜访[MASK]。'
词性标注
可用于日语文本的词性标注任务。
依存句法分析
可用于日语文本的依存句法分析任务。