T

Transformers Ud Japanese Electra Base Ginza 510

由 megagonlabs 开发
基于ELECTRA架构的日语预训练模型,使用mC4数据集约2亿句日语文本预训练,并在UD_日语_BCCWJ语料上微调
下载量 7,757
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个日语自然语言处理模型,基于ELECTRA架构,专门针对日语文本进行优化,能够识别日语文节结构。

模型特点

基于大规模日语语料训练
使用mC4数据集中约2亿句日语文本进行预训练
专业领域微调
在UD_日语_BCCWJ语料上进行微调,优化了日语依存句法分析能力
与GiNZA集成
可与GiNZA v5配合使用,提供完整的日语NLP处理能力

模型能力

日语文本分析
依存句法分析
文节结构识别

使用案例

自然语言处理
日语文本解析
分析日语句子的结构和依存关系
准确识别日语文节结构
日语NLP应用开发
作为日语NLP应用的基础模型