C

Chinese Electra Small Generator

由 hfl 开发
中文ELECTRA是哈工大-讯飞联合实验室基于谷歌ELECTRA架构开发的中文预训练模型,参数量仅为BERT的1/10但性能相近。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于ELECTRA架构的中文预训练模型,采用生成器-判别器结构进行高效预训练,适用于多种自然语言处理任务。

模型特点

高效预训练
采用ELECTRA的替换标记检测预训练方法,比传统MLM更高效
参数精简
small版模型参数量仅为BERT的1/10,但性能相近
中文优化
专门针对中文文本特性进行优化训练

模型能力

文本理解
文本表示学习
掩码语言建模

使用案例

自然语言处理
文本分类
用于情感分析、新闻分类等文本分类任务
问答系统
作为问答系统的预训练基础模型