P

Pixart XL 2 512x512

由 PixArt-alpha 开发
Pixart-α是基于Transformer架构的文本生成图像模型,可直接通过文本提示生成1024像素图像,训练效率显著优于同类模型。
下载量 3,971
发布时间 : 11/4/2023
模型介绍
内容详情
替代品

模型简介

采用纯Transformer模块构建的潜在扩散模型,使用固定预训练文本编码器(T5)和潜在特征编码器(VAE),能够高效生成高质量图像。

模型特点

高效训练
仅需Stable Diffusion v1.5训练时间的10.8%,节省近30万美元成本,减少90%碳排放
高质量生成
在用户评估中表现媲美甚至超越SDXL、DALLE-2等SOTA模型
直接高分辨率生成
单次采样即可生成1024像素图像,无需多阶段处理

模型能力

文本生成图像
高分辨率图像生成
艺术创作
设计辅助

使用案例

创意设计
艺术创作
根据文字描述生成艺术作品
生成具有艺术风格的图像
概念设计
快速生成产品/场景概念图
帮助设计师快速可视化创意
教育研究
生成模型研究
研究扩散模型的训练效率和生成质量
提供高效的模型架构参考