开源controlnet-canny-sdxl-1.0-small模型 - 用Canny边缘检测控制，小巧高效！

首页

Controlnet Canny Sdxl 1.0 Small

由 diffusers 开发

基于Stable Diffusion XL训练的小型控制网络，专用于Canny边缘检测条件控制，体积比原始XL控制网络小7倍

图像生成 #Canny边缘控制 #SDXL轻量优化 #图像生成控制

下载量 567

发布时间 : 8/15/2023

模型简介

该模型是Stable Diffusion XL的轻量级控制网络版本，专注于通过Canny边缘检测实现精确的图像生成控制。它保留了原始SDXL的强大生成能力，同时显著减小了模型体积。

模型特点

轻量级设计

模型体积比原始XL控制网络小7倍，更适合资源有限的环境

精确边缘控制

通过Canny边缘检测实现高精度的图像结构控制

保留SDXL特性

基于stabilityai/stable-diffusion-xl-base-1.0训练，保留了原始模型的强大生成能力

实验性质

模型仍处于实验阶段，鼓励社区继续优化和改进

模型能力

基于边缘检测的图像生成

高精度结构控制

照片级真实感图像生成

艺术风格图像生成

使用案例

创意设计

概念艺术创作

根据边缘草图生成完整的艺术概念图

示例展示了未来主义研究基地的鸟瞰图

人像摄影增强

基于边缘轮廓生成高质量人像照片

示例展示了特写女性肖像，具有照片级真实感

影视游戏

角色设计

根据简单线稿生成完整角色形象

示例展示了天启世界中的威震天形象

场景设计

基于边缘图生成复杂场景

示例展示了废墟城市背景

🚀 Small SDXL - controlnet: Canny

Small SDXL - controlnet: Canny 是基于 stabilityai/stable - diffusion - xl - base - 1.0 训练的控制网络权重，采用 Canny 条件。此检查点比原始的 XL 控制网络检查点小 7 倍。下面为你展示一些示例图片。

🚀 快速开始

安装依赖

确保首先安装所需的库：

pip install accelerate transformers safetensors opencv-python diffusers

运行示例代码

安装完成后，就可以运行以下代码：

from diffusers import ControlNetModel, StableDiffusionXLControlNetPipeline, AutoencoderKL
from diffusers.utils import load_image
from PIL import Image
import torch
import numpy as np
import cv2

prompt = "aerial view, a futuristic research complex in a bright foggy jungle, hard lighting"
negative_prompt = "low quality, bad quality, sketches"

image = load_image("https://huggingface.co/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

controlnet_conditioning_scale = 0.5  # recommended for good generalization

controlnet = ControlNetModel.from_pretrained(
    "diffusers/controlnet-canny-sdxl-1.0-small",
    torch_dtype=torch.float16
)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    vae=vae,
    torch_dtype=torch.float16,
)
pipe.enable_model_cpu_offload()

image = np.array(image)
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
image = Image.fromarray(image)

images = pipe(
    prompt, negative_prompt=negative_prompt, image=image, controlnet_conditioning_scale=controlnet_conditioning_scale,
).images

images[0].save(f"hug_lab.png")

hug_lab_grid)

更多详细信息，请查看 StableDiffusionXLControlNetPipeline 的官方文档。

✨ 主要特性

体积小巧：此检查点比原始的 XL 控制网络检查点小 7 倍。
实验性：该检查点处于实验阶段，有很大的改进空间，欢迎社区在此基础上进行优化并提供反馈。

💻 使用示例

基础用法

from diffusers import ControlNetModel, StableDiffusionXLControlNetPipeline, AutoencoderKL
from diffusers.utils import load_image
from PIL import Image
import torch
import numpy as np
import cv2

prompt = "aerial view, a futuristic research complex in a bright foggy jungle, hard lighting"
negative_prompt = "low quality, bad quality, sketches"

image = load_image("https://huggingface.co/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

controlnet_conditioning_scale = 0.5  # recommended for good generalization

controlnet = ControlNetModel.from_pretrained(
    "diffusers/controlnet-canny-sdxl-1.0-small",
    torch_dtype=torch.float16
)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    vae=vae,
    torch_dtype=torch.float16,
)
pipe.enable_model_cpu_offload()

image = np.array(image)
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
image = Image.fromarray(image)

images = pipe(
    prompt, negative_prompt=negative_prompt, image=image, controlnet_conditioning_scale=controlnet_conditioning_scale,
).images

images[0].save(f"hug_lab.png")

高级用法

目前文档未提及高级用法相关代码，可参考官方文档进行更多探索。

🔧 技术细节

训练脚本

训练脚本基于官方提供的脚本构建，可参考此处。完整披露可参考此脚本。

训练特点

未进行蒸馏：此检查点未执行蒸馏操作，仅使用从 SDXL UNet 初始化的较小 ControlNet。鼓励社区尝试进行蒸馏操作，可参考此资源。
ControlNet 初始化：关于 ControlNet 的初始化方式，可参考此代码块。
无注意力块：该模型没有任何注意力块。
性能表现：模型在大多数条件图像上表现良好，但对于更复杂的条件，较大的检查点可能效果更好。目前正在努力改进此检查点的质量，并期待社区提供反馈。
参数建议：建议尝试调整 controlnet_conditioning_scale 和 guidance_scale 参数，以获得更好的图像生成质量。