P

Pixart XL 2 1024 MS

由 PixArt-alpha 开发
Pixart-α是基于Transformer架构的高效文本生成图像模型,能以极低训练成本生成1024像素高质量图像
下载量 119.36k
发布时间 : 11/4/2023
模型介绍
内容详情
替代品

模型简介

采用纯Transformer模块构建的潜在扩散模型,可直接通过文本提示生成高分辨率图像,训练效率显著优于同类模型

模型特点

超高训练效率
仅需SDv1.5 10.8%的训练成本(675 A100 GPU天),节省90%碳排放
单阶段高分辨率生成
直接生成1024px图像,无需多阶段处理
Transformer架构
纯Transformer模块构建,支持高效并行计算
开源生态
完整代码开源,集成Diffusers库,支持HuggingFace/Colab体验

模型能力

文本生成图像
高分辨率图像生成
艺术风格创作
概念可视化

使用案例

创意设计
艺术创作辅助
根据文字描述快速生成概念草图
加速设计流程,激发创作灵感
教育可视化
生成教学用示意图
复杂概念的直观呈现
技术研究
生成模型研究
高效扩散模型架构探索
提供低成本研究基准