S

Sroberta F

由 Andrija 开发
基于43GB克罗地亚语和塞尔维亚语数据集训练的RoBERTa模型,支持掩码语言模型任务。
下载量 51
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对克罗地亚语和塞尔维亚语优化的RoBERTa模型,主要用于自然语言处理任务,特别是掩码语言模型任务。

模型特点

多源训练数据
整合了Leipzig、OSCAR、srWac、hrWac、cc100-hr和cc100-sr等多个高质量数据集,共计43GB文本数据。
持续训练潜力
训练过程未出现停滞现象,仍有继续优化的空间。
双语支持
专门针对克罗地亚语和塞尔维亚语进行优化训练。

模型能力

文本理解
语言建模
上下文预测

使用案例

自然语言处理
文本补全
预测被掩码遮盖的词语
示例:'Ovo je početak <mask>.' 可预测补全句子
语言模型微调
作为基础模型用于下游NLP任务