D

Dc Ae F32c32 Sana 1.1 Diffusers

由 mit-han-lab 开发
DC-AE是一种用于加速高分辨率扩散模型的新型自编码器架构,通过残差自编码和解耦高分辨率适配技术,在高空间压缩比下保持重建质量。
下载量 1,127
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

DC-AE解决了高空间压缩比自编码器重建精度下降的问题,显著加速扩散模型的训练和推理过程,同时保持图像生成质量。

模型特点

高压缩比重建
支持高达128倍的空间压缩比,同时保持高质量图像重建能力
残差自编码
基于空间-通道变换特征学习残差,缓解高压缩比自编码器的优化难题
解耦高分辨率适配
采用三阶段解耦训练策略,减轻高压缩比自编码器的泛化惩罚
高效推理
相比SD-VAE-f8自编码器,为UViT-H模型带来19.1倍推理加速

模型能力

高分辨率图像生成
图像压缩与重建
高效扩散模型加速

使用案例

创意内容生成
艺术创作
快速生成高质量艺术图像
512x512分辨率图像生成
工业设计
产品原型设计
基于文本描述生成产品设计概念图
高保真度图像输出