B

Bigbird Base Japanese

由 nlp-waseda 开发
基于日语维基百科、CC-100和OSCAR数据集预训练的日语BigBird模型,适用于长序列处理任务。
下载量 38
发布时间 : 6/3/2023
模型介绍
内容详情
替代品

模型简介

这是一个基于日语维基百科、CC-100日语部分和OSCAR日语部分预训练的日语BigBird基础模型,主要用于掩码语言建模和下游任务微调。

模型特点

长序列处理
支持最大4096长度的序列处理,适合处理长文本任务。
高效预训练
使用16块NVIDIA A100 GPU和DeepSpeed优化,训练效率高。
专业分词
输入文本需使用Juman++进行专业分词,确保语言处理准确性。

模型能力

日语文本理解
掩码语言建模
长序列处理
下游任务微调

使用案例

文本分类
情感分析
对日语文本进行情感倾向分类
在MARC-ja任务上准确率达到0.959
语义相似度
句子相似度计算
计算两个日语句子的语义相似度
在JSTS任务上皮尔逊系数达到0.888
问答系统
日语阅读理解
基于给定文本回答日语问题
在JSQuAD任务上F1值达到0.933