B

Bert Base Arabic Camelbert Ca

由 CAMeL-Lab 开发
CAMeLBERT是针对阿拉伯语变体优化的BERT模型集合,CA版本专门针对古典阿拉伯语文本预训练
下载量 1,128
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于古典阿拉伯语(CA)数据集预训练的BERT模型,适用于阿拉伯语NLP任务微调

模型特点

古典阿拉伯语优化
专门针对6GB古典阿拉伯语文本预训练,在诗歌分类等CA任务上表现优异(F1 80.9%)
多任务适配
支持NER、词性标注、情感分析、方言识别和诗歌分类等12个阿拉伯语NLP任务
变体敏感处理
保留字母大小写及重音符号,采用全词掩码策略增强语言特征学习

模型能力

掩码语言建模
下一句预测
命名实体识别
词性标注
情感分析
方言识别
诗歌分类

使用案例

古典文学分析
阿拉伯诗歌分类
对古典阿拉伯诗歌进行自动分类
在APCD数据集上达到80.9% F1分数
语言学研究
古典文本分析
分析古典阿拉伯语文本的语言特征
教育技术
阿拉伯语学习辅助
帮助学习者理解古典阿拉伯语语法和词汇