🚀 SDXL-controlnet: OpenPose (v2)
这是一个基于StableDiffusionXL的ControlNet模型,使用OpenPose (v2)条件进行训练,可用于文本到图像的生成。
🚀 快速开始
此项目是 thibaud/controlnet-openpose-sdxl-1.0 的副本,允许通过 diffusers
库直接使用其 safetensors
版本。
✨ 主要特性
- 基于
stabilityai/stable-diffusion-xl-base-1.0
训练,使用OpenPose (v2) 条件。
- 可通过
diffusers
库方便地集成和使用。
- 提供了训练脚本和相关参数说明。
📦 安装指南
首先,安装所有必要的库:
pip install -q controlnet_aux transformers accelerate
pip install -q git+https://github.com/huggingface/diffusers
💻 使用示例
基础用法
现在,我们可以让达斯·维达跳舞啦:
from diffusers import AutoencoderKL, StableDiffusionXLControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
import torch
from controlnet_aux import OpenposeDetector
from diffusers.utils import load_image
openpose = OpenposeDetector.from_pretrained("lllyasviel/ControlNet")
image = load_image(
"https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/person.png"
)
openpose_image = openpose(image)
controlnet = ControlNetModel.from_pretrained("dimitribarbot/controlnet-openpose-sdxl-1.0-safetensors", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0", controlnet=controlnet, torch_dtype=torch.float16
)
pipe.enable_model_cpu_offload()
prompt = "Darth vader dancing in a desert, high quality"
negative_prompt = "low quality, bad quality"
images = pipe(
prompt,
negative_prompt=negative_prompt,
num_inference_steps=25,
num_images_per_prompt=4,
image=openpose_image.resize((1024, 1024)),
generator=torch.manual_seed(97),
).images
images[0]
以下是一些生成的示例:

示例图片
提示词:a ballerina, romantic sunset, 4k photo

Comfy工作流
(图片来自ComfyUI,你可以将其拖放到Comfy中作为工作流使用)
🔧 技术细节
训练
使用HF🤗 的训练脚本 点击此处查看。
训练数据
此检查点首先在调整为最大最小尺寸为768的laion 6a上训练了15,000步。
计算资源
一台1xA100机器 (非常感谢HF🤗 提供计算资源!)
批量大小
数据并行,单GPU批量大小为2,梯度累积为8。
超参数
恒定学习率为8e-5
混合精度
fp16
📄 许可证
许可证:参考OpenPose的许可证。