M

Myanberta

由 UCSYNLP 开发
MyanBERTa是基于BERT架构的缅甸语预训练语言模型,在包含5,992,299个句子的缅甸语数据集上进行了预训练。
下载量 91
发布时间 : 7/25/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个专门针对缅甸语的预训练语言模型,采用BERT架构和字节级BPE分词器,适用于各种缅甸语自然语言处理任务。

模型特点

缅甸语专用
专门针对缅甸语设计和优化,能够更好地处理缅甸语的语言特性。
大规模预训练
在包含5,992,299个句子(1.36亿词)的大规模缅甸语数据集上进行预训练。
高效分词
采用字节级BPE分词器,学习得到30,522个子词单元作为分词工具。

模型能力

缅甸语文本理解
缅甸语文本生成
缅甸语语言特征提取

使用案例

自然语言处理
缅甸语文本分类
对缅甸语文本进行情感分析或主题分类
缅甸语问答系统
构建基于缅甸语的智能问答应用