S

Sundanese Roberta Base

由 w11wo 开发
基于RoBERTa架构的巽他语掩码语言模型,在多个数据集上训练而成。
下载量 32
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于RoBERTa架构的巽他语掩码语言模型,主要用于巽他语的文本理解和生成任务。

模型特点

多数据集训练
在OSCAR、mC4、CC100和维基百科四个数据集上训练,确保模型广泛覆盖巽他语用法。
高准确率
验证准确率达到63.98%,在巽他语任务中表现良好。
专门针对巽他语优化
专门为巽他语设计和训练,相比多语言模型有更好的语言理解能力。

模型能力

巽他语文本理解
掩码语言预测
文本特征提取

使用案例

教育
巽他语学习辅助
帮助学生理解和学习巽他语语法和词汇。
自然语言处理
巽他语文本分析
用于巽他语文本的分类、情感分析等任务。