D

Distilbert Base Nepali

由 Sakonii 开发
这是一个基于尼泊尔语文本预训练的DistilBERT模型,专门针对尼泊尔语的下游任务优化。
下载量 109
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于包含超过1300万尼泊尔语文本序列的数据集,采用掩码语言建模(MLM)目标进行预训练,适用于尼泊尔语的文本处理任务。

模型特点

尼泊尔语优化
专门针对尼泊尔语训练,使用包含1300万文本序列的数据集。
高效架构
采用DistilBERT架构,在保持性能的同时减少模型大小和计算需求。
自定义分词器
使用句子片段模型(SPM)进行文本分词,词汇量达24576。

模型能力

尼泊尔语文本理解
掩码语言预测
下游任务微调

使用案例

文本处理
文本补全
预测文本中被掩码标记的词语
在评估集上取得10.479的困惑度
下游任务微调
可用于序列分类、标记分类或问答等任务