D

Deberta V2 Base Japanese

由 ku-nlp 开发
基于日语维基百科、CC-100和OSCAR语料预训练的日语DeBERTa V2基础模型,适用于掩码语言建模和下游任务微调。
下载量 38.93k
发布时间 : 1/5/2023
模型介绍
内容详情
替代品

模型简介

这是一个基于大规模日语语料预训练的DeBERTa V2模型,主要用于日语文本的掩码语言建模任务,也可通过微调应用于各种自然语言理解任务。

模型特点

高质量日语预训练
使用日语维基百科、CC-100和OSCAR等高质量日语语料进行预训练,覆盖广泛的日语语言特征。
专业分词处理
输入文本需通过Juman++进行专业分词处理,确保模型对日语文本的准确理解。
多任务适应能力
除掩码语言建模外,还可通过微调应用于多种自然语言理解任务,如文本分类、问答等。

模型能力

日语文本理解
掩码语言建模
自然语言处理任务微调

使用案例

自然语言理解
文本分类
可用于日语文本分类任务,如情感分析、主题分类等。
在MARC-ja任务上准确率达0.970
语义相似度计算
可用于计算日语文本对之间的语义相似度。
在JSTS任务上皮尔逊相关系数达0.922
问答系统
可用于构建日语问答系统。
在JSQuAD任务上F1分数达0.951