P

Pixart Sigma XL 2 1024 MS

由 PixArt-alpha 开发
PixArt-Σ是基于Transformer架构的潜在扩散模型,可直接通过文本提示生成高分辨率图像(最高4K)。
下载量 7,283
发布时间 : 4/11/2024
模型介绍
内容详情
替代品

模型简介

采用纯Transformer模块构建的潜在扩散模型,支持单次采样生成1024像素、2K及4K分辨率图像,集成T5文本编码器和VAE潜在特征编码器。

模型特点

高分辨率生成
支持单次采样生成最高4K分辨率的图像
高效Transformer架构
采用纯Transformer模块构建,计算效率优于传统扩散模型
多模态集成
集成T5文本编码器和VAE潜在特征编码器,实现高质量文本-图像对齐

模型能力

文本生成图像
高分辨率图像生成
图像编辑

使用案例

创意设计
艺术创作辅助
根据文字描述自动生成创意概念图
快速可视化创意构思
设计原型生成
为产品/界面设计提供快速原型
加速设计迭代过程
教育研究
生成模型研究
探索扩散Transformer架构的性能边界
推动生成模型技术进步