Q

Quberta

由 Llamacha 开发
基于RoBERTa架构的南克丘亚语(科拉奥和昌卡方言)预训练模型,使用500万token训练
下载量 289
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

专门针对克丘亚语优化的语言模型,支持文本填充等自然语言处理任务

模型特点

克丘亚语专用模型
专门针对南克丘亚语的科拉奥和昌卡方言进行优化
大规模预训练
使用500万条克丘亚语token进行预训练
高效分词器
采用包含52000个子词单元的字节级BPE分词器

模型能力

克丘亚语文本理解
克丘亚语文本生成
克丘亚语文本填充

使用案例

自然语言处理
克丘亚语句子补全
自动补全克丘亚语中的缺失词汇
示例显示能生成符合语境的补全建议
克丘亚语语法检查
通过填充任务辅助检查克丘亚语语法