许可证:其他
许可证名称:公平AI公共许可证1.0-sd
许可证链接:https://freedevproject.org/faipl-1.0-sd/
语言:
- 英语
基础模型:
- Laxhar/noobai-XL-Vpred-0.65
管道标签:文本到图像
标签:
- 安全张量
- 扩散器
- 稳定扩散
- 稳定扩散XL
- 艺术
- 非全年龄段适用
库名称:扩散器
NoobAI XL V-Pred 0.75s
模型介绍
本图像生成模型基于Laxhar/noobai-XL_v1.0,充分利用了完整的Danbooru和e621数据集,包含原生标签和自然语言标注。
作为v-prediction模型(不同于eps-prediction),需要特定的参数配置——详情见后续章节。
特别感谢我的队友euge的编码工作,同时我们也感激许多热心社区成员的技术支持。
⚠️ 重要通知 ⚠️
本模型与EPS模型工作方式不同!
请仔细阅读指南!
模型详情
- 开发者:Laxhar实验室
- 模型类型:基于扩散的文本到图像生成模型
- 微调自:Laxhar/noobai-XL_v1.0
- 赞助方:蓝云科技
如何使用模型
- (如果尚未安装reForge)按照仓库中的说明安装reForge;
- 启动WebUI并正常使用模型!
节点示例
comfy_ui_workflow_sample
注意开发分支不稳定,可能包含错误。
- (如果尚未安装WebUI)按照仓库中的说明安装WebUI。
- 切换到
dev
分支:
git switch dev
- 拉取最新更新:
git pull
- 启动WebUI并正常使用模型!
import torch
from diffusers import StableDiffusionXLPipeline
from diffusers import EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """杰作,最佳质量,艺术家:john_kafka,艺术家:nixeu,艺术家:quasarcake,色差,胶片颗粒,恐怖(主题),有限调色板,X形瞳孔,高对比度,色彩对比,冷色调,阿蕾奇诺(原神),黑色主题,粗犷,石墨(媒介)"""
negative_prompt = "NSFW,最差质量,老旧,早期,低质量,低分辨率,签名,用户名,标志,坏手,变异手,哺乳动物,兽人,毛茸茸,模糊形态,野生,半兽人"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
注意:请确保已安装Git并正确配置环境。
推荐设置
参数
- CFG:4 ~ 5
- 步数:28 ~ 35
- 采样方法:Euler(⚠️ 其他采样器无法正常工作)
- 分辨率:总面积约1024x1024。最佳选择:768x1344,832x1216,896x1152,1024x1024,1152x896,1216x832,1344x768
提示词
杰作,最佳质量,最新,超高分辨率,高分辨率,安全,
NSFW,最差质量,老旧,早期,低质量,低分辨率,签名,用户名,标志,坏手,变异手,哺乳动物,兽人,毛茸茸,模糊形态,野生,半兽人
使用指南
标注
<1girl/1boy/1other/...>, <角色>, <系列>, <艺术家>, <特殊标签>, <通用标签>, <其他标签>
质量标签
对于质量标签,我们通过以下流程评估图像受欢迎程度:
- 基于多种来源和评分的数据标准化。
- 根据日期远近应用时间衰减系数。
- 在整个数据集中根据此处理对图像进行排名。
我们的最终目标是确保质量标签能有效追踪近年来的用户偏好。
百分位范围 |
质量标签 |
> 95% |
杰作 |
> 85%,≤ 95% |
最佳质量 |
> 60%,≤ 85% |
良好质量 |
> 30%,≤ 60% |
普通质量 |
≤ 30% |
最差质量 |
美学标签
日期标签
日期标签分为两类:年份标签和时期标签。年份标签使用year xxxx
格式,如year 2021
。时期标签请参考下表:
年份范围 |
时期标签 |
2005-2010 |
老旧 |
2011-2014 |
早期 |
2014-2017 |
中期 |
2018-2020 |
近期 |
2021-2024 |
最新 |
数据集
交流
如何在v-pred SDXL模型上训练LoRA
针对基于sd-scripts的LoRA训练者的教程。
文章链接:https://civitai.com/articles/8723
实用工具
Laxhar实验室正在为NoobXL训练专用的ControlNet模型,模型正在逐步发布。目前已经发布了普通、深度和边缘检测模型。
模型链接:https://civitai.com/models/929685
模型许可证
本模型的许可证继承自https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0 fair-ai-public-license-1.0-sd,并添加了以下条款。任何使用本模型及其变体的行为均受此许可证约束。
I. 使用限制
- 禁止用于有害、恶意或非法活动,包括但不限于骚扰、威胁和传播错误信息。
- 禁止生成不道德或冒犯性内容。
- 禁止违反用户所在地区的法律法规。
II. 商业禁止
我们禁止任何形式的商业化行为,包括但不限于对模型、衍生模型或模型生成产品的货币化或商业使用。
III. 开源社区
为了促进开源社区的繁荣,用户必须遵守以下要求:
- 开源衍生模型、合并模型、LoRA及基于上述模型的产品。
- 分享工作细节,如合成公式、提示词和工作流程。
- 遵循fair-ai-public-license,确保衍生作品保持开源。
IV. 免责声明
生成的模型可能产生意外或有害的输出。用户必须承担使用过程中的所有风险和潜在后果。
参与者和贡献者
参与者
贡献者
-
Narugo1992: 感谢narugo1992和deepghs团队开源各种训练集、图像处理工具和模型。
-
Mikubill: 感谢Mikubill的Naifu训练器。
-
Onommai: 感谢OnommAI开源强大的基础模型。
-
V-Prediction: 感谢以下人士的详细指导和实验。
-
社区: aria1th261, neggles, sdtana, chewing, irldoggo, reoe, kblueleaf, Yidhar, ageless, 白玲可, Creeper, KaerMorh, 吟游诗人, SeASnAkE, zwh20081, Wenaka~喵, 稀里哗啦, 幸运二副, 昨日の約, 445, EBIX, Sopp, Y_X, Minthybasis, Rakosz