I

Indobert Large P1

由 indobenchmark 开发
IndoBERT 是基于 BERT 模型的印度尼西亚语先进语言模型,通过掩码语言建模和下一句预测目标进行训练。
下载量 1,686
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

IndoBERT 是一个针对印度尼西亚语优化的预训练语言模型,适用于各种自然语言处理任务。

模型特点

大规模预训练
使用 Indo4B 数据集(23.43GB 文本)进行预训练
不区分大小写
模型处理文本时不区分大小写
两阶段训练
模型经过两个阶段的训练过程(P1 和 P2)

模型能力

文本表示学习
语言理解
文本分类
问答系统
命名实体识别

使用案例

自然语言处理
文本分类
对印度尼西亚语文本进行分类
问答系统
构建印度尼西亚语问答系统