G

Gpt2 Wechsel Chinese

由 benjamin 开发
采用WECHSEL方法训练的中文GPT-2模型,通过子词嵌入的有效初始化实现单语语言模型的跨语言迁移。
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于GPT-2架构的中文语言模型,使用WECHSEL方法从英语GPT-2迁移而来,适用于中文文本生成任务。

模型特点

跨语言迁移
使用WECHSEL方法实现从英语到中文的有效迁移,减少训练成本。
高效训练
相比从头训练,该方法最高可减少64倍训练成本。
性能优越
在中文文本生成任务上表现优于从头训练的GPT-2模型。

模型能力

中文文本生成
语言模型迁移

使用案例

自然语言处理
中文文本生成
生成连贯的中文文本
困惑度为51.97,优于从头训练的GPT-2模型(52.98)