L

Ldm Celebahq 256

由 CompVis 开发
潜在扩散模型(LDM)是一种在潜在空间中应用扩散模型的高效图像生成方法,显著降低了计算需求同时保持高质量生成效果。
下载量 268
发布时间 : 7/15/2022
模型介绍
内容详情
替代品

模型简介

LDM通过在预训练自编码器的潜在空间中应用扩散模型,实现了复杂度降低与细节保留的平衡,支持无条件图像生成、语义场景合成和超分辨率等任务。

模型特点

潜在空间扩散
在预训练自编码器的潜在空间中应用扩散模型,显著降低计算需求同时保持高质量生成效果。
高效推理
相比基于像素的扩散模型,LDM在推理时显著减少了计算资源消耗。
灵活的条件控制
通过交叉注意力层支持文本或边界框等通用条件输入,实现可控的图像生成。

模型能力

无条件图像生成
高分辨率图像合成
潜在空间图像处理

使用案例

创意内容生成
人脸图像生成
使用CelebA-HQ数据集训练的模型生成高质量人脸图像
生成256x256分辨率的人脸图像
图像处理
图像超分辨率
将低分辨率图像转换为高分辨率版本