A

Aragpt2 Mega

由 aubmindlab 开发
AraGPT2是一个针对阿拉伯语生成任务预训练的大型语言模型系列,包含基础版、中型、大型和巨型四种规模。
下载量 998
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

AraGPT2是基于GPT2架构的阿拉伯语生成模型,使用大规模阿拉伯语数据集训练,支持文本生成等任务。

模型特点

阿拉伯语优化
专门针对阿拉伯语文本进行优化训练,使用AraBERTv2相同的大规模数据集
多规模选择
提供从基础版(1.35亿参数)到巨型(14.6亿参数)四种规模选择
TPU优化训练
支持TPU训练,巨型模型使用TPUv3-128训练78万步
兼容Transformers
可通过HuggingFace Transformers库加载使用

模型能力

阿拉伯语文本生成
文本自动补全
语言模型微调

使用案例

内容生成
阿拉伯语文章生成
根据提示生成连贯的阿拉伯语文章
可生成符合阿拉伯语语法和表达习惯的长文本
教育应用
阿拉伯语学习辅助
生成阿拉伯语学习材料和练习题