C

Cpt Base

由 fnlp 开发
面向中文理解与生成任务的非对称预训练Transformer模型
下载量 37
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

CPT是一个专门针对中文文本处理设计的预训练模型,支持文本生成、分类、摘要等多种任务,采用非对称Transformer架构优化中文处理效果。

模型特点

优化中文词表
包含51271个词项,补全6800+缺失汉字并移除冗余标记,显著降低未登录词比例
长序列支持
位置编码扩展至1024长度,增强长文本处理能力
非对称架构
编码器-解码器结构针对中文理解与生成任务进行专门优化

模型能力

中文文本生成
文本分类
摘要生成
掩码语言建模
序列到序列任务

使用案例

文本生成
自动摘要
对长文本生成简洁摘要
在LCSTS数据集上达到38.81 ROUGE-L分数
文本理解
语义匹配
判断句子对语义相关性
在AFQMC任务上达到74.4准确率