C

Convbert Base Generator Finnish

由 Finnish-NLP 开发
基于替换令牌检测(RTD)目标预训练的芬兰语ConvBERT生成器模型,专用于填充掩码任务。
下载量 36
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是芬兰语的ConvBERT生成器模型,采用替换令牌检测(RTD)目标进行预训练,主要用于填充掩码任务。

模型特点

替换令牌检测(RTD)目标
采用RTD目标进行预训练,通过判别模型预测被替换的令牌,而非传统的掩码语言建模。
混合注意力块
结合跨度的动态卷积和自注意力头,有效建模局部和全局输入序列依赖。
大规模芬兰语预训练
在多个芬兰语数据集上预训练,包括清理后的mC4、维基百科和新闻档案等。

模型能力

填充掩码
芬兰语文本理解

使用案例

自然语言处理
填充掩码任务
用于预测句子中被掩码的单词,例如'Moikka olen [MASK] kielimalli.'。
模型能够生成合理的芬兰语单词填充掩码位置。