I

Indonesian Roberta Base

由 flax-community 开发
基于RoBERTa架构的印尼语掩码语言模型,在OSCAR语料库上训练,验证准确率62.45%
下载量 1,013
发布时间 : 3/2/2022

模型简介

这是一个专门针对印尼语优化的RoBERTa基础模型,适用于各种自然语言处理任务,特别是掩码语言建模任务。

模型特点

印尼语专用模型
专门针对印尼语优化的预训练模型,在印尼语任务上表现优异
基于RoBERTa架构
采用经过验证的RoBERTa架构,提供强大的语言理解能力
高效训练
使用Google Cloud的TPUv3-8虚拟机进行高效训练,总耗时仅18小时25分

模型能力

掩码语言建模
印尼语文本理解
特征提取

使用案例

自然语言处理
文本补全
预测句子中被掩码的词语
示例:'Budi sedang <mask> di sekolah.'可预测出合适的动词
特征提取
为下游NLP任务提取文本特征
AIbase
智启未来,您的人工智能解决方案智库
简体中文