C

CPM Generate

由 TsinghuaAI 开发
CPM是基于Transformer的26亿参数中文预训练语言模型,使用100GB中文语料训练,支持多种自然语言处理任务。
下载量 622
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

大规模生成式中文预训练语言模型,适用于文本生成、对话系统、完形填空等下游任务。

模型特点

大规模中文预训练
使用100GB多样化中文语料训练,涵盖百科、网页、新闻等多领域数据
少样本学习能力
在零样本/少样本设定下仍能取得优异表现,降低下游任务微调成本
多任务支持
支持生成、分类、填空等多种自然语言处理任务

模型能力

中文文本生成
对话系统构建
文章续写
成语填空
文本分类

使用案例

内容创作
新闻摘要生成
根据新闻正文自动生成摘要
在TNEWS数据集零样本准确率达70.3%
教育应用
成语填空辅助
自动补全句子中的缺失成语
ChID数据集无监督准确率68.5%
智能对话
短文本对话生成
生成连贯的对话回复
STC数据集词级Dist-2达0.233