E

Efficient Mlm M0.15

由 princeton-nlp 开发
该模型研究了在掩码语言建模中遮蔽15%内容的有效性,采用了前置层归一化方法。
下载量 116
发布时间 : 4/22/2022
模型介绍
内容详情
替代品

模型简介

该模型专注于掩码语言建模任务,探讨了遮蔽比例对模型性能的影响,并采用了前置层归一化的架构。

模型特点

前置层归一化
采用了前置层归一化方法,这是一种不常见的架构选择,可能影响模型训练稳定性。
遮蔽比例研究
专门研究了15%遮蔽比例在掩码语言建模中的效果。

模型能力

掩码语言建模
文本表示学习

使用案例

自然语言处理研究
遮蔽策略研究
用于研究不同遮蔽比例对语言模型性能的影响
提供了15%遮蔽比例的具体效果分析
文本表示学习
下游任务预训练
可作为其他NLP任务的预训练模型