D

Dc Ae F32c32 Sana 1.1

由 mit-han-lab 开发
DC-AE是一种用于加速高分辨率扩散模型的新型自编码器架构,解决了高压缩比下的重建精度问题
下载量 18.17k
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

该模型通过残差自编码和解耦高分辨率适配技术,显著提升了自编码器的空间压缩比,同时保持重建质量,可大幅加速扩散模型的训练和推理过程

模型特点

高压缩比
支持高达128倍的空间压缩比,远超传统自编码器的8倍压缩比
残差自编码
通过空间-通道变换特征学习残差,有效缓解高压缩比下的优化难题
解耦训练策略
采用三阶段解耦训练策略,减轻高压缩比自编码器的泛化惩罚
高效加速
在ImageNet 512x512数据集上实现19.1倍推理加速和17.9倍训练加速

模型能力

高分辨率图像压缩
潜在空间特征提取
图像重建
加速扩散模型训练
加速扩散模型推理

使用案例

计算机视觉
高分辨率图像生成
用于加速高分辨率扩散模型的训练和推理过程
在保持生成质量的同时显著提升速度
图像压缩与重建
实现高压缩比下的高质量图像重建
128倍压缩比下仍能保持良好重建质量