B

Bangla Bert

由 Kowsher 开发
基于BERT架构预训练的孟加拉语语言模型,支持掩码语言建模任务
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门针对孟加拉语优化的BERT模型,可用于各种自然语言处理任务,如文本分类、命名实体识别和掩码语言预测。

模型特点

孟加拉语优化
专门针对孟加拉语进行预训练和优化
掩码语言预测
支持高质量的掩码词语预测任务
大规模语料训练
使用约40GB的BanglaLM数据集进行训练

模型能力

文本标记化
掩码语言预测
文本理解
语言建模

使用案例

自然语言处理
文本补全
预测句子中被掩码的词语
示例显示能准确预测常见短语如'বাংলা আমার অহংকার'(孟加拉是我的骄傲)
重复检测
识别文本中的重复模式
能准确识别重复词语如'রাজাকার'(叛徒)