B

Bangla Bert Base

由 sagorsarker 开发
Bangla BERT 基础版是基于BERT架构预训练的孟加拉语语言模型,支持多种下游NLP任务。
下载量 7,282
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门针对孟加拉语优化的BERT模型,采用掩码语言建模方法预训练,适用于文本分类、命名实体识别等自然语言处理任务。

模型特点

孟加拉语专用预训练
专门针对孟加拉语进行预训练,相比多语言模型在孟加拉语任务上表现更优
优化的词汇表
使用BNLP工具包训练包含102025个词汇的孟加拉语句子片段模型
全面评估
在多个孟加拉语基准测试中取得最先进的结果

模型能力

文本分类
命名实体识别
掩码语言预测
句子标记化

使用案例

情感分析
孟加拉语情感分类
分析孟加拉语文本的情感倾向
在基准测试中获得70.37%准确率
内容审核
仇恨言论检测
识别孟加拉语中的仇恨言论
在基准测试中获得71.83%准确率
新闻分类
新闻主题分类
对孟加拉语新闻按主题分类
在基准测试中获得89.19%准确率