G

Gerpt2 Large

由 benjamin 开发
GerPT2是德语版GPT2的大规模版本,基于CC-100语料库和德语维基百科训练,在德语文本生成任务上表现优异。
下载量 75
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

GerPT2是基于GPT2架构的德语语言模型,提供大规模和小规模两个版本,专注于德语文本生成任务。

模型特点

优异的德语文本生成能力
在CC-100和德语维基百科数据集上的困惑度显著优于同类德语GPT2模型
基于大规模德语语料训练
使用CC-100语料库的全部德语数据和德语维基百科进行训练
优化的训练策略
采用OneCycle学习率调度和权重衰减的AdamW优化器,训练2个周期

模型能力

德语文本生成
德语文本续写
德语语言理解

使用案例

内容创作
德语文章生成
根据提示生成连贯的德语文章
生成文本质量高,困惑度低
德语对话系统
用于构建德语聊天机器人
教育
德语学习辅助
生成德语学习材料和练习