C

Chinese Electra Base Generator

由 hfl 开发
中文ELECTRA是由哈工大-讯飞联合实验室(HFL)基于谷歌与斯坦福大学发布的ELECTRA模型开发的中文预训练模型,具有参数量小、性能高的特点。
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ELECTRA是一种高效的预训练模型,通过替换BERT的掩码语言模型任务为判别任务,显著提升了训练效率。中文ELECTRA系列模型在多项NLP任务中表现优异,且参数量仅为BERT的1/10。

模型特点

高效预训练
采用ELECTRA的生成器-判别器架构,训练效率显著高于传统BERT模型
小参数量高性能
ELECTRA-small仅需BERT及其变体1/10的参数量,即可达到相近甚至更高的性能
中文优化
专门针对中文语言特点进行优化,在中文NLP任务中表现优异

模型能力

文本理解
文本生成
语义分析

使用案例

自然语言处理
文本分类
可用于情感分析、主题分类等文本分类任务
问答系统
适用于构建中文问答系统
命名实体识别
可用于中文命名实体识别任务