S

Sinhalaberto

由 keshan 开发
这是一个基于OSCAR僧伽罗语去重数据集训练的稍小模型,为低资源僧伽罗语提供基础支持。
下载量 34
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Roberta架构训练的僧伽罗语语言模型,主要用于掩码语言建模任务,为下游任务提供预训练基础。

模型特点

低资源语言支持
专门针对资源稀缺的僧伽罗语进行优化训练
轻量级架构
采用6层隐藏层的精简Roberta架构,适合资源有限环境
大规模预训练数据
基于OSCAR去重数据集训练,涵盖广泛语言特征

模型能力

文本填充
语言建模
上下文预测

使用案例

自然语言处理
文本补全
自动补全僧伽罗语句子中的缺失部分
可准确预测句子中被掩码的词汇
语言模型微调
作为下游NLP任务的预训练基础模型
为各类僧伽罗语NLP应用提供迁移学习基础