E

Electra Large Generator

由 google 开发
ELECTRA是一种高效的自监督语言表示学习方法,通过判别式预训练替代传统生成式预训练,显著提升计算效率。
下载量 473
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ELECTRA采用判别器架构预训练Transformer模型,通过区分真实标记与生成器伪造的标记来学习语言表示,在GLUE、SQuAD等任务中表现优异。

模型特点

高效预训练
相比传统MLM预训练方法,计算效率提升4倍以上
判别式学习
采用GAN式判别器架构,学习区分真实/伪造标记
多尺度适配
提供Base/Small/Large等多种参数规模选择

模型能力

文本编码
语言理解
掩码预测
下游任务微调

使用案例

自然语言理解
GLUE基准测试
在通用语言理解评估基准上取得优异表现
超越BERT同参数规模模型
问答系统
应用于SQuAD问答数据集
在SQuAD 2.0达到当时SOTA
文本处理
序列标注
支持文本分块等序列标注任务