开源协议: mit
基础模型: stabilityai/stable-diffusion-xl-base-1.0
标签:
- stable-diffusion
- stable-diffusion-diffusers
- 文本生成图像
- diffusers
- lora
推理支持: 是
触发词: sonic the hedgehog
示例输入:
- 文本: sonic the hedgehog
sdxl-ugly-sonic-lora

这是一个为SDXL 1.0基础模型设计的LoRA,用于生成丑版索尼克,使用sonic the hedgehog
作为触发关键词。
使用方法
可以通过diffusers
中的load_lora_weights
加载此LoRA,与其他LoRA的使用方式相同:
import torch
from diffusers import DiffusionPipeline, AutoencoderKL
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.float16
)
base = DiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0",
vae=vae,
torch_dtype=torch.float16,
variant="fp16",
use_safetensors=True
)
base.load_lora_weights("minimaxir/sdxl-ugly-sonic-lora")
_ = base.to("cuda")
在生成图像时,请在提示词中使用sonic the hedgehog
。
示例
所有生成示例均使用负面提示词blurry, low quality
。提示词权重通过compel语法实现。
sonic the hedgehog relaxing on a couch, renaissance painting, (oil on canvas, aged, worn)++++
(cfg = 13)

a profile of sonic the hedgehog sitting at a desk deep in thought, (pixel art)++++, award-winning photo for vanity fair
(cfg = 13)

anatomical diagram of sonic the hedgehog, (highly detailed)++++
(cfg = 13)

sonic the hedgehog (eating at McDonald's)++, Ukiyo-e, minimalistic vector art
(cfg = 13)

(hyperrealistic++ death metal album cover)+++ featuring edgy moody realistic human sonic the hedgehog, edgy and moody
(cfg = 13)

(hyperrealistic tall human)+++ sonic the hedgehog cameoing in an (episode of Friends)+++++, high quality hyperrealistic promotional photo
(cfg = 13)

训练方法
此LoRA基于原版1080p预告片中"丑版索尼克"的逐帧分析训练而成。将丑版索尼克的画面裁剪为正方形,并通过AI放大至1024x1024分辨率以优化训练效果。
使用sonic the hedgehog
作为触发关键词(并在训练中对应此关键词)可确保不会意外生成另一只刺猬。毕竟没人喜欢那家伙。
注意事项
- 丑版索尼克的CGI风格可能会压制其他风格提示词。因此,建议像示例中那样大幅提高风格提示词的权重。
- 尝试用此提示词生成人类时可能会出现半刺猬半人的混合体。这可能是优点也可能是缺点,具体取决于你的需求,但可以通过明确指定
human
并调整权重来控制效果。