S

Sinbert Small

由 NLPC-UOM 开发
SinBERT是基于RoBERTa架构在大型僧伽罗语单语语料库(sin-cc-15M)上预训练的模型,适用于僧伽罗语文本处理任务。
下载量 126
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对僧伽罗语文本处理进行了优化,可用于各种僧伽罗语自然语言处理任务。

模型特点

僧伽罗语专用预训练
使用大型僧伽罗语单语语料库(sin-cc-15M)进行预训练,针对僧伽罗语特性优化
基于RoBERTa架构
采用RoBERTa架构,继承了其优秀的文本处理能力
学术研究支持
相关研究发表在LREC 2022会议上

模型能力

僧伽罗语文本理解
僧伽罗语文本分类

使用案例

学术研究
僧伽罗语文本分析
用于僧伽罗语语言学研究和文本分析
商业应用
僧伽罗语内容分类
可用于僧伽罗语新闻、社交媒体内容的自动分类