🚀 Holodayo XL 2.1
Holodayo XL 2.1 是 Yodayo Holodayo XL 系列的最新版本,它基于 Animagine XL V3 这一专门用于生成高质量动漫风格艺术作品的 SDXL 模型构建。该模型经过额外的微调与优化,专注于生成能够精准呈现虚拟主播系列视觉风格和美学的图像。
🚀 快速开始
你可以在以下平台使用这个模型:
- 在我们的平台使用此模型:

- 在
ComfyUI
或 Stable Diffusion Webui
中使用。
- 使用 🧨
diffusers
库进行使用。
✨ 主要特性
- 优化改进:修复了 Holodayo XL 2.0 中存在的诸多问题,如手部绘制不佳、人体结构不准确、因微调阶段训练文本编码器导致的灾难性遗忘,以及通过减少美学数据集解决过度曝光的艺术风格问题。
- 继承特殊标签:继承了 Animagine XL 3.1 的特殊标签,可增强图像生成效果,引导结果朝着质量、评级、创作日期和美学方向发展。
📦 安装指南
首先安装所需的库:
pip install diffusers transformers accelerate safetensors --upgrade
💻 使用示例
基础用法
import torch
from diffusers import StableDiffusionXLPipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
"yodayo-ai/holodayo-xl-2.1",
torch_dtype=torch.float16,
use_safetensors=True,
custom_pipeline="lpw_stable_diffusion_xl",
add_watermarker=False,
variant="fp16"
)
pipe.to('cuda')
prompt = "1girl, nakiri ayame, nakiri ayame \(1st costume\), hololive, solo, upper body, v, smile, looking at viewer, outdoors, night, masterpiece, best quality, very aesthetic, absurdres"
negative_prompt = "nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
guidance_scale=7,
num_inference_steps=28
).images[0]
image.save("./waifu.png")
📚 详细文档
标签排序
为获得最佳效果,建议遵循以下结构化提示模板,因为我们是按照此方式训练模型的:
1girl/1boy, 角色名称, 所属系列, 艺术家, 其他信息(顺序不限)。
特殊标签
Holodayo XL 2.1 继承了 Animagine XL 3.1 的特殊标签,以增强图像生成效果,引导结果朝着质量、评级、创作日期和美学方向发展。即使不使用这些标签,模型也能生成图像,但使用它们有助于获得更好的结果。
- 质量标签:masterpiece(杰作), best quality(最佳质量), great quality(高质量), good quality(良好质量), normal quality(普通质量), low quality(低质量), worst quality(最差质量)
- 评级标签:safe(安全), sensitive(敏感), nsfw(不适合工作场合), explicit(露骨)
- 年份标签:newest(最新), recent(近期), mid(中期), early(早期), oldest(最旧)
- 美学标签:very aesthetic(非常美观), aesthetic(美观), displeasing(令人不悦), very displeasing(非常令人不悦)
推荐设置
为引导模型生成高美学的图像,建议使用以下设置:
nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn
masterpiece, best quality, very aesthetic, absurdres
- 无分类器引导(CFG)比例:应在 5 到 7 左右;10 会使图像效果过度,大于 12 则会严重失真。
- 采样步数:应在 25 到 30 左右;28 是最佳值。
- 采样器:强烈推荐使用 Euler Ancestral(Euler a)。
- 支持的分辨率:
1024 x 1024, 1152 x 896, 896 x 1152, 1216 x 832, 832 x 1216, 1344 x 768, 768 x 1344, 1536 x 640, 640 x 1536
🔧 技术细节
以下是训练期间使用的关键超参数:
特性 |
预训练 |
微调 |
硬件 |
2x H100 80GB PCIe |
2x A100 80GB PCIe |
批量大小 |
64 |
48 |
梯度累积步数 |
2 |
1 |
噪声偏移 |
无 |
0.0357 |
训练轮数 |
10 |
10 |
UNet 学习率 |
7.5e - 6 |
7.5e - 6 |
文本编码器学习率 |
3.75e - 6 |
无 |
优化器 |
AdamW8bit |
Adafactor |
优化器参数 |
权重衰减:0.1,贝塔值:(0.9, 0.99) |
缩放参数:False,相对步长:False,预热初始化:False |
调度器 |
带预热的常数调度器 |
带预热的常数调度器 |
预热步数 |
0.5% |
0.5% |
📄 许可证
Holodayo XL 2.1 遵循 Fair AI Public License 1.0 - SD 许可证,该许可证与 Stable Diffusion 模型的许可证兼容。关键点如下:
- 修改共享:如果你修改了 Holodayo XL 2.1,必须同时共享你的修改内容和原始许可证。
- 源代码可访问性:如果你的修改版本可以通过网络访问,需提供一种方式(如下载链接)让他人获取源代码。这也适用于派生模型。
- 分发条款:任何分发都必须遵循此许可证或其他具有类似规则的许可证。