G

Gerpt2

由 benjamin 开发
GerPT2是基于GPT2架构的德语大语言模型,在CC-100和德语维基百科数据集上训练,性能优于同类德语GPT2模型。
下载量 48
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

德语版GPT2大模型,支持德语文本生成任务,在困惑度指标上表现优异。

模型特点

卓越的德语性能
在CC-100和德语维基百科数据集上的困惑度指标显著优于dbmdz/german-gpt2模型
英语到德语的语义映射
通过generate_aligned_wte.py脚本实现英语到德语的词嵌入对齐,提升生成质量
优化的生成控制
提供bad_words_ids等参数配置,有效控制生成文本的终止条件

模型能力

德语文本生成
上下文理解
长文本生成

使用案例

内容创作
德语文章生成
根据提示生成连贯的德语文章
生成文本具有较低的困惑度指标
语言研究
德语语言模型研究
作为德语NLP研究的基线模型
提供优于同类模型的基准性能