开源chinese-electra-small-generator模型 - 小参数高性能的实用中文预训练利器

首页

Chinese Electra Small Generator

由 hfl 开发

中文ELECTRA是哈工大-讯飞联合实验室基于谷歌ELECTRA架构开发的中文预训练模型，参数量仅为BERT的1/10但性能相近。

大型语言模型

Transformers

中文开源协议:Apache-2.0 #轻量高效 #中文预训练 #填充掩码

下载量 16

发布时间 : 3/2/2022

模型简介

基于ELECTRA架构的中文预训练模型，采用生成器-判别器结构进行高效预训练，适用于多种自然语言处理任务。

模型特点

高效预训练

采用ELECTRA的替换标记检测预训练方法，比传统MLM更高效

参数精简

small版模型参数量仅为BERT的1/10，但性能相近

中文优化

专门针对中文文本特性进行优化训练

模型能力

文本理解

文本表示学习

掩码语言建模

使用案例

自然语言处理

文本分类

用于情感分析、新闻分类等文本分类任务

问答系统

作为问答系统的预训练基础模型

🚀 中文ELECTRA

本项目的中文ELECTRA模型，旨在进一步推动中文预训练模型的研究。与BERT及其变体相比，它模型规模更紧凑，性能却颇具竞争力。ELECTRA-small仅用BERT及其变体十分之一的参数，就能在多个NLP任务中取得相近甚至更高的分数。

🚀 快速开始

若你要重新训练这些模型，请使用ElectraForPreTraining作为discriminator，使用ElectraForMaskedLM作为generator。

✨ 主要特性

Google和斯坦福大学发布了名为ELECTRA的新型预训练模型。与BERT及其变体相比，它的模型规模紧凑，性能颇具竞争力。
哈工大讯飞联合实验室（HFL）基于ELECTRA官方代码发布了中文ELECTRA模型。
ELECTRA-small仅用BERT及其变体十分之一的参数，就能在多个NLP任务中取得相近甚至更高的分数。

📚 详细文档

本项目基于ELECTRA的官方代码：https://github.com/google-research/electra

你可能还对以下项目感兴趣：

中文BERT系列：https://github.com/ymcui/Chinese-BERT-wwm
中文ELECTRA：https://github.com/ymcui/Chinese-ELECTRA
中文XLNet：https://github.com/ymcui/Chinese-XLNet
知识蒸馏工具包 - TextBrewer：https://github.com/airaria/TextBrewer

HFL的更多资源：https://github.com/ymcui/HFL-Anthology

📄 许可证

本项目采用Apache-2.0许可证。

📚 引用

如果你发现我们的资源或论文有用，请在你的论文中引用以下内容：

https://arxiv.org/abs/2004.13922

@inproceedings{cui-etal-2020-revisiting,
    title = "Revisiting Pre-Trained Models for {C}hinese Natural Language Processing",
    author = "Cui, Yiming  and
      Che, Wanxiang  and
      Liu, Ting  and
      Qin, Bing  and
      Wang, Shijin  and
      Hu, Guoping",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.58",
    pages = "657--668",
}