S

Stable Diffusion V1 2

由 CompVis 开发
基于扩散的文本生成图像模型,能够根据文本提示生成逼真图像
下载量 1,322
发布时间 : 8/19/2022
模型介绍
内容详情
替代品

模型简介

稳定扩散是一种潜在文本到图像扩散模型,采用潜在扩散模型架构,使用固定预训练文本编码器(CLIP ViT-L/14),能够根据任意文本输入生成和修改图像。

模型特点

高分辨率图像生成
能够生成512x512分辨率的高质量图像
潜在空间处理
在潜在空间而非像素空间进行扩散过程,提高效率
美学优化训练
在筛选的高质量图像数据集(laion-improved-aesthetics)上微调
多调度器支持
支持PNDM、LMSDiscrete等多种噪声调度器

模型能力

文本到图像生成
图像修改
艺术创作
设计辅助

使用案例

艺术创作
概念艺术生成
根据文字描述生成艺术概念图
可快速产生创意视觉表达
教育研究
生成模型研究
研究扩散模型的局限性和偏差