K

Kyrgyzbert

由 metinovadilet 开发
基于BERT架构的小规模语言模型,专为吉尔吉斯语自然语言处理应用设计。
下载量 79
发布时间 : 2/26/2025
模型介绍
内容详情
替代品

模型简介

吉尔吉斯Bert是一个基于BERT架构的小规模语言模型,在大量吉尔吉斯语文本语料库上进行了预训练,适用于掩码语言建模(MLM)、文本分类及吉尔吉斯语自然语言处理应用。

模型特点

定制吉尔吉斯语分词器
使用专门为吉尔吉斯语定制的分词器,优化了语言处理效果。
小规模BERT架构
采用小规模BERT架构,隐藏层维度512,层数6,注意力头数8,适合资源有限的环境。
高性能预训练
在包含150万句以上的吉尔吉斯语文本语料库上进行预训练,优化了掩码语言建模任务。

模型能力

文本补全与预测
特征提取
情感分析
命名实体识别(NER)
机器翻译

使用案例

文本处理
填充缺失词汇
填充吉尔吉斯文本中的缺失词汇,适用于文本补全与预测任务。
自然语言处理
情感分析
通过微调模型,可用于吉尔吉斯语的情感分析任务。
命名实体识别(NER)
通过微调模型,可用于识别吉尔吉斯语文本中的命名实体。