SRoBERTa - F开源模型 - 基于大量克塞语数据集，支持掩码语言模型任务

首页

Sroberta F

由 Andrija 开发

基于43GB克罗地亚语和塞尔维亚语数据集训练的RoBERTa模型，支持掩码语言模型任务。

大型语言模型

Transformers

其他开源协议:Apache-2.0 #克罗地亚语-塞尔维亚语双语 #掩码语言建模 #低困惑度优化

下载量 51

发布时间 : 3/2/2022

模型简介

这是一个针对克罗地亚语和塞尔维亚语优化的RoBERTa模型，主要用于自然语言处理任务，特别是掩码语言模型任务。

模型特点

多源训练数据

整合了Leipzig、OSCAR、srWac、hrWac、cc100-hr和cc100-sr等多个高质量数据集，共计43GB文本数据。

持续训练潜力

训练过程未出现停滞现象，仍有继续优化的空间。

双语支持

专门针对克罗地亚语和塞尔维亚语进行优化训练。

模型能力

文本理解

语言建模

上下文预测

使用案例

自然语言处理

文本补全

预测被掩码遮盖的词语

示例：'Ovo je početak <mask>.' 可预测补全句子

语言模型微调

作为基础模型用于下游NLP任务

属性	详情
模型类型	`Andrija/SRoBERTa - F`
训练数据	Leipzig语料库、OSCAR、srWac、hrWac、cc100 - hr和cc100 - sr（43GB文本）
参数数量	80M
架构	Fifth

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Sroberta F

模型简介

模型特点

模型能力

使用案例

🚀 克罗地亚语和塞尔维亚语Transformer语言模型

🚀 快速开始

✨ 主要特性

📚 详细文档

数据集

支持语言

标签

小部件示例

许可证

模型信息