S

Sinbert Large

由 NLPC-UOM 开发
SinBERT是基于RoBERTa架构的僧伽罗语预训练语言模型,在大型僧伽罗语单语语料库(sin-cc-15M)上训练。
下载量 150
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SinBERT模型专为僧伽罗语文本处理设计,适用于各种自然语言处理任务,如文本分类等。

模型特点

僧伽罗语优化
专门针对僧伽罗语进行预训练,优化了该语言的文本处理能力。
基于RoBERTa架构
采用RoBERTa架构,继承了其优秀的自然语言处理能力。
大规模训练数据
使用sin-cc-15M大型僧伽罗语单语语料库进行训练。

模型能力

文本分类
自然语言理解
文本特征提取

使用案例

文本分析
僧伽罗语文本分类
对僧伽罗语文本进行分类任务
在LREC 2022论文中展示了良好的分类性能