U

Uztext 3Gb BPE Roberta

由 rifkat 开发
预训练的乌兹别克语(西里尔与拉丁字母)掩码语言建模及句子预测模型
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的乌兹别克语预训练模型,支持西里尔和拉丁字母文本处理,主要用于掩码语言建模和句子预测任务。

模型特点

双字母支持
同时支持乌兹别克语的西里尔字母和拉丁字母文本处理
大规模预训练
基于约3GB的乌兹别克语新闻数据进行预训练
掩码预测能力
能够准确预测文本中的掩码位置内容

模型能力

乌兹别克语文本理解
掩码语言建模
句子预测
西里尔字母处理
拉丁字母处理

使用案例

文本补全
历史人物描述补全
补全关于历史人物的描述文本
准确预测'阿里舍尔·纳沃伊是伟大的乌兹别克及其他突厥民族诗人、思想家和政治家'中的'诗人'
新闻事件描述
自然灾害报道补全
补全自然灾害报道中的关键信息
准确预测'由于强降雨,多个区域观测到强烈泥石流'中的'区域'