U

Uzbert Base Uncased

由 coppercitylabs 开发
针对乌兹别克语(西里尔字母)开发的预训练BERT模型,采用掩码语言建模和下一句预测目标进行训练。
下载量 82
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门为乌兹别克语设计,支持西里尔字母,适用于自然语言处理任务如文本填充和句子关系预测。

模型特点

乌兹别克语专用
专门针对乌兹别克语(西里尔字母)优化的BERT模型
无大小写区分
模型不区分大小写,适合处理各种文本格式
大规模预训练
基于约62.5万篇新闻文章(约1.42亿词)进行预训练

模型能力

文本填充
句子关系预测
乌兹别克语文本理解

使用案例

自然语言处理
文本填充
预测被掩码遮挡的词语
示例中'诗人'的预测准确率达79.7%
文本理解
理解乌兹别克语文本的语义