S

Stable Cascade

由 stabilityai 开发
基于Würstchen架构的高效文本生成图像模型,通过42倍压缩因子实现快速推理和低成本训练
下载量 24.96k
发布时间 : 2/6/2024
模型介绍
内容详情
替代品

模型简介

Stable Cascade是一个三阶段的文本到图像生成模型,通过高度压缩的潜在空间显著降低计算成本,同时保持高质量的图像生成能力

模型特点

高效压缩架构
采用42倍压缩因子(1024x1024→24x24),相比Stable Diffusion的8倍压缩显著提升效率
低成本训练
早期版本相比Stable Diffusion 1.5降低16倍训练成本
兼容扩展功能
支持LoRA、ControlNet、IP-Adapter、LCM等扩展功能
多版本选择
提供不同参数规模的模型版本(10亿/36亿参数等)满足不同需求

模型能力

文本生成图像
高分辨率图像生成(1024x1024)
快速推理
图像重建

使用案例

艺术创作
概念艺术生成
根据文本描述生成创意概念艺术图像
高质量的艺术作品
设计应用
产品原型设计
快速生成产品设计原型图像
加速设计流程
教育研究
生成模型研究
研究高效生成模型的架构和性能