I

Indobert Lite Large P1

由 indobenchmark 开发
IndoBERT是针对印尼语的先进语言模型,基于BERT架构,采用掩码语言建模和下一句预测目标进行训练。
下载量 42
发布时间 : 3/2/2022

模型简介

IndoBERT是专门为印尼语设计的预训练语言模型,主要用于自然语言理解任务。该模型通过大规模印尼语语料库训练,能够有效处理印尼语文本的语义理解任务。

模型特点

针对印尼语优化
专门为印尼语设计和训练,能够更好地理解和处理印尼语文本。
轻量级模型
相比完整版IndoBERT,Lite版本参数更少,适合资源有限的环境。
大规模训练数据
使用Indo4B数据集(23.43GB印尼语文本)进行训练。

模型能力

印尼语文本理解
掩码语言建模
下一句预测

使用案例

自然语言处理
文本分类
对印尼语文本进行分类任务
命名实体识别
识别印尼语文本中的命名实体
AIbase
智启未来,您的人工智能解决方案智库
简体中文