G

Gpt2 Medium Chinese Cluecorpussmall

由 uer 开发
基于CLUECorpusSmall预训练的轻量级中文GPT2模型,6层/768维结构,专为中文文本生成优化
下载量 863
发布时间 : 7/17/2023
模型介绍
内容详情
替代品

模型简介

该模型是GPT2的轻量级中文版本,适用于中文文本生成任务,采用蒸馏技术减少参数量同时保持生成质量

模型特点

轻量级架构
采用6层Transformer结构,相比标准GPT2模型参数量减少50%
中文优化
专门针对中文文本特点进行预训练,支持流畅的中文生成
两阶段训练
先以短序列(128)训练,再以长序列(1024)微调,提升生成连贯性

模型能力

中文文本生成
文本续写
对话生成
创意写作

使用案例

内容创作
文章续写
根据开头段落自动生成后续内容
生成连贯的中文文本,保持主题一致性
对话系统
聊天机器人
生成自然流畅的中文对话回复
示例输出显示情感表达和上下文理解能力