G

Gpt2 Wechsel German

由 benjamin 开发
该模型采用WECHSEL方法训练,通过子词嵌入的有效初始化实现单语语言模型的跨语言迁移,特别针对德语优化。
下载量 36
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于WECHSEL方法训练的GPT-2德语版本,通过高效的跨语言迁移技术实现德语文本生成能力。

模型特点

跨语言迁移
使用WECHSEL方法实现从英语到德语的参数高效迁移,显著降低训练成本。
高效训练
相比从头训练,该方法可减少高达64倍的训练成本。
性能优越
在困惑度指标上优于同规模从头训练的模型。

模型能力

德语文本生成
语言模型迁移

使用案例

自然语言处理
德语文本生成
生成连贯的德语文本
困惑度26.8,优于从头训练的模型(27.63)