B

Bert Base Parsbert Uncased

由 HooshvareLab 开发
基于Transformer架构的波斯语理解模型,性能超越多语言BERT和其他混合模型
下载量 99.81k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ParsBERT是基于BERT架构的单语种波斯语预训练模型,在情感分析、文本分类和命名实体识别等下游任务中表现出色

模型特点

波斯语优化
专门针对波斯语特性进行优化,包括词性标注和WordPiece分词预处理
全词掩码训练
采用全词掩码(Whole Word Masking)技术提升模型理解能力
大规模语料
基于200万+文档、4000万+句子的波斯语语料库训练

模型能力

波斯语文本理解
情感分析
文本分类
命名实体识别

使用案例

情感分析
用户评论情感分析
分析Digikala和SnappFood等平台的用户评论情感倾向
在Digikala数据集上F1达81.74,超越mBERT
文本分类
新闻分类
对波斯语新闻进行自动分类
在波斯新闻数据集上F1达97.19
命名实体识别
波斯语实体识别
识别波斯文本中的人名、地名等实体
在PEYMA数据集上F1达93.10