NitroFusion开源图像生成模型 - 高保真单步扩散，轻松创优质图像

首页

Nitrofusion

由 ChenDY 开发

通过动态对抗训练实现高保真单步扩散的图像生成模型

图像生成 #单步文生图 #对抗扩散蒸馏 #高保真图像

下载量 490

发布时间 : 11/30/2024

模型简介

氮气融合是一种基于对抗扩散蒸馏技术的文生图模型，能够实现1-4步快速生成高质量图像，提供写实和鲜艳两种风格选择。

模型特点

单步生成

支持仅需1步推理即可生成高质量图像

双风格选择

提供照片级写实和高饱和度色彩两种风格模型

动态对抗训练

采用时间步偏移技术优化多步推理效果

高效推理

1-4步即可完成图像生成，显著提升生成速度

模型能力

文本到图像生成

快速图像合成

风格化图像生成

使用案例

创意设计

概念艺术创作

快速生成设计概念图

1步生成可用草图，4步获得精细作品

内容生产

社交媒体配图

批量生成风格统一的宣传图片

支持快速迭代不同风格方案

🚀 NitroFusion

NitroFusion是一个通过动态对抗训练实现高保真单步扩散的项目。该项目提出了新的方法，在文本到图像生成领域展现出高效且优质的图像生成能力，为相关研究和应用提供了新的思路和工具。

基础信息

属性	详情
基础模型	tianweiy/DMD2、ByteDance/Hyper - SD、stabilityai/stable - diffusion - xl - base - 1.0
任务类型	文本到图像
库名称	diffusers
标签	文本到图像、稳定扩散、SDXL、对抗扩散蒸馏

🚀 快速开始

你可以通过以下链接快速了解和体验NitroFusion：

✨ 主要特性

模型概览

nitrosd - realism_unet.safetensors：能生成具有精细细节的逼真图像。
nitrosd - vibrant_unet.safetensors：生成的图像具有鲜艳、饱和的色彩特征。
两个模型均支持1到4步推理。

💻 使用示例

基础用法

首先，我们需要实现带有时间步偏移的调度器以进行多步推理：

from diffusers import LCMScheduler
class TimestepShiftLCMScheduler(LCMScheduler):
    def __init__(self, *args, shifted_timestep=250, **kwargs):
        super().__init__(*args, **kwargs)
        self.register_to_config(shifted_timestep=shifted_timestep)
    def set_timesteps(self, *args, **kwargs):
        super().set_timesteps(*args, **kwargs)
        self.origin_timesteps = self.timesteps.clone()
        self.shifted_timesteps = (self.timesteps * self.config.shifted_timestep / self.config.num_train_timesteps).long()
        self.timesteps = self.shifted_timesteps
    def step(self, model_output, timestep, sample, generator=None, return_dict=True):
        if self.step_index is None:
            self._init_step_index(timestep)
        self.timesteps = self.origin_timesteps
        output = super().step(model_output, timestep, sample, generator, return_dict)
        self.timesteps = self.shifted_timesteps
        return output

然后，我们可以使用扩散器管道：

import torch
from diffusers import DiffusionPipeline, UNet2DConditionModel
from huggingface_hub import hf_hub_download
from safetensors.torch import load_file
# Load model.
base_model_id = "stabilityai/stable-diffusion-xl-base-1.0"
repo = "ChenDY/NitroFusion"
# NitroSD-Realism
ckpt = "nitrosd-realism_unet.safetensors"
unet = UNet2DConditionModel.from_config(base_model_id, subfolder="unet").to("cuda", torch.float16)
unet.load_state_dict(load_file(hf_hub_download(repo, ckpt), device="cuda"))
scheduler = TimestepShiftLCMScheduler.from_pretrained(base_model_id, subfolder="scheduler", shifted_timestep=250)
scheduler.config.original_inference_steps = 4
# # NitroSD-Vibrant
# ckpt = "nitrosd-vibrant_unet.safetensors"
# unet = UNet2DConditionModel.from_config(base_model_id, subfolder="unet").to("cuda", torch.float16)
# unet.load_state_dict(load_file(hf_hub_download(repo, ckpt), device="cuda"))
# scheduler = TimestepShiftLCMScheduler.from_pretrained(base_model_id, subfolder="scheduler", shifted_timestep=500)
# scheduler.config.original_inference_steps = 4
pipe = DiffusionPipeline.from_pretrained(
    base_model_id,
    unet=unet,
    scheduler=scheduler,
    torch_dtype=torch.float16,
    variant="fp16",
).to("cuda")
prompt = "a photo of a cat"
image = pipe(
    prompt=prompt,
    num_inference_steps=1,  # NotroSD-Realism and -Vibrant both support 1 - 4 inference steps.
    guidance_scale=0,
).images[0]

ComfyUI使用方法

下载nitrosd - realism_comfyui.safetensors和nitrosd - vibrant_comfyui.safetensors，并将它们放在ComfyUI/models/checkpoints目录下。
将ComfyUI - TimestepShiftModel仓库克隆到ComfyUI/custom_nodes目录下。
尝试使用工作流！