B

Bert Medium Amharic

由 rasyosef 开发
基于bert-medium架构预训练的阿姆哈拉语模型,参数量4050万,在2.9亿词元上训练,性能媲美更大规模的多语言模型。
下载量 2,661
发布时间 : 6/16/2024
模型介绍
内容详情
替代品

模型简介

专为阿姆哈拉语设计的BERT模型,支持填充掩码任务,可用于文本理解和生成任务。

模型特点

高效参数利用
仅4050万参数即达到与2.79亿参数模型相当的阿姆哈拉语处理能力
专用分词器
基于28k词汇量的阿姆哈拉语专用分词器
多数据集训练
整合oscar、mc4和阿姆哈拉语句子语料库进行训练

模型能力

阿姆哈拉语文本理解
填充掩码预测
下游任务微调

使用案例

自然语言处理
情感分析
对阿姆哈拉语文本进行情感倾向分类
F1分数0.83
命名实体识别
识别阿姆哈拉语文本中的人名、地名等实体
F1分数0.68