D

Distilbert Base Indonesian

由 cahya 开发
这是印尼语BERT基础模型的蒸馏版本,专为印尼语处理设计,采用无大小写格式。
下载量 1,815
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于印尼语数据集预训练的语言模型,适用于文本分类、文本生成等下游任务。

模型特点

蒸馏模型
基于印尼语BERT基础模型的蒸馏版本,保留了大部分性能但模型更轻量。
无大小写处理
所有输入文本均经过小写处理,简化了文本预处理步骤。
印尼语优化
专门针对印尼语进行预训练,适合印尼语文本处理任务。

模型能力

掩码语言建模
文本特征提取
文本分类
文本生成

使用案例

文本处理
填充掩码
预测句子中被掩码的词语
如示例所示,能准确预测印尼语语境中的合适词语
文本特征提取
获取文本的向量表示
可用于下游任务如分类或相似度计算