N

Nepalibert

由 Shushant 开发
基于尼泊尔语新闻数据的掩码语言模型,训练数据来自多个尼泊尔新闻网站,包含约1000万条尼泊尔语句子,内容主要为新闻。
下载量 701.51k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在BERT基础架构上微调的尼泊尔语掩码语言模型,主要用于尼泊尔语相关的自然语言处理任务。

模型特点

大规模尼泊尔语训练数据
训练数据包含约1000万条尼泊尔语句子,主要来自新闻网站,文本量约4.6GB。
高性能评估结果
在评估集上表现良好,损失值为1.0495,困惑度为8.56。
GPU加速训练
使用Tesla V100 GPU进行训练,耗时约3天8小时57分钟。

模型能力

尼泊尔语文本理解
尼泊尔语文本生成
尼泊尔语情感分析

使用案例

自然语言处理
尼泊尔语情感分析
用于分析尼泊尔推文的情感倾向
表现优于其他现有的尼泊尔语掩码语言模型
尼泊尔语文本补全
填补尼泊尔语句子中的缺失部分