I

Indobert Base P1

由 indobenchmark 开发
IndoBERT是基于BERT模型的印尼语先进语言模型,采用掩码语言建模(MLM)和下一句预测(NSP)目标进行训练。
下载量 261.95k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

IndoBERT是一个针对印尼语优化的预训练语言模型,基于BERT架构,适用于各种自然语言处理任务。

模型特点

印尼语优化
专门针对印尼语进行训练和优化,适用于印尼语的自然语言处理任务。
基于BERT架构
采用BERT模型架构,具有强大的语言理解和生成能力。
大规模训练数据
使用Indo4B数据集(23.43 GB文本)进行训练,覆盖广泛的印尼语内容。

模型能力

文本理解
文本生成
语言模型预训练
句子关系预测

使用案例

自然语言处理
文本分类
对印尼语文本进行分类任务
问答系统
构建印尼语问答系统
文本生成
生成印尼语文本内容