J

Javanese Distilbert Small

由 w11wo 开发
基于DistilBERT的爪哇语掩码语言模型,在爪哇语维基百科上训练
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于DistilBERT架构的爪哇语掩码语言模型,主要用于爪哇语的文本理解和生成任务。

模型特点

高效轻量
基于DistilBERT架构,参数量仅为66M,相比完整BERT模型更轻量高效
爪哇语优化
专门针对爪哇语进行训练和优化,适合爪哇语文本处理
维基百科训练
使用爪哇语维基百科最新文章进行训练,覆盖广泛主题

模型能力

掩码语言预测
爪哇语文本理解
爪哇语文本生成

使用案例

自然语言处理
文本补全
预测句子中被掩码的词语
示例:'Joko [MASK] wis kelas siji SMA.' 可预测出合适的词语
特征提取
提取爪哇语文本的语义特征
可用于下游NLP任务如分类或聚类