语言:
- 英文
许可证: creativeml-openrail-m
标签:
- 稳定扩散
- 稳定扩散-扩散器
- 文本到图像
- 扩散器
推理: 是
Evt_V4-预览版
EVT系列是一个针对动画风格模型进行大规模数据集微调的实验性项目。
Evt_V4使用了比以往更大的数据集,其与ACertainty的余弦相似度达到了85%。
它的表现可能与其他模型有所不同,希望您会喜欢。
🧐 扩散器
该模型可以像其他任何稳定扩散模型一样使用。更多信息,
请参阅稳定扩散。
您还可以将模型导出为ONNX、MPS和/或FLAX/JAX格式。
from diffusers import StableDiffusionPipeline
import torch
model_id = "haor/Evt_V4-preview"
branch_name= "main"
pipe = StableDiffusionPipeline.from_pretrained(model_id, revision=branch_name, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl"
image = pipe(prompt).images[0]
image.save("./1girl.png")
示例
提示1:

1girl穿着黑色水手服站在田野中,独照,食物,水果,柠檬,泡泡,星球,月亮,橙子(水果),柠檬片,叶子,鱼,橙子片,作者(tabi:1.25),点彩,看向观众,近景牛仔镜头
负面提示: (差:0.81), (漫画:0.81), (裁剪:0.81), (错误:0.81), (多余:0.81), (低:0.81), (低分辨率:0.81), (对话:0.81), (最差:0.81), (脸红:0.9), 2格漫画, 3格漫画, 4格漫画, 拼贴, 口红
步数: 20, 采样器: DPM++ SDE Karras, CFG比例: 7, 种子: 2285895007, 尺寸: 512x1152, 去噪强度: 0.7, 剪辑跳过: 2
提示2:

{杰作, 鹿目圆, 高挑的双长马尾, 根根分明的头发, (粉色头发), 粉色眼睛, 交叉刘海, 大小姐, 女高中生, 大腿绷带, 手腕袖口, (粉色蝴蝶结: 1.2)}, 纯色, 素描, 杰作, 高细节, 杰作肖像, 最佳质量, 光线追踪, {:<, 看向边缘}
负面提示: ((((丑陋)))), (((重复))), ((病态)), ((残缺)), 多余手指, 变异的手, ((画得不好的手)), ((画得不好的脸)), (((比例失调))), ((多余肢体)), (((变形))), (((毁容))), 克隆脸, 比例失调, (畸形的肢体), ((缺少手臂)), ((缺少腿)), (((多余手臂))), (((多余腿))), 太多手指, (((长脖子))), (((低质量))), 普通质量, 模糊, 糟糕的脚, 文本字体UI, ((((最差质量)))), 解剖学上的荒谬, (((糟糕的阴影))), 不自然的身体, 液态身体, 3D, 3D游戏, 3D游戏场景, 3D角色, 糟糕的头发, 画得不好的头发, 融合的头发, 大肌肉, 糟糕的脸, 多余的眼睛, 毛茸茸, 小马, 马赛克, 消失的小腿, 消失的腿, 多余的脚趾, 缺少脚趾, 融合的脚趾, 缺失的脚趾, 融合的脚, 画得不好的眼睛, 大脸, 长脸, 糟糕的眼睛, 厚嘴唇, 肥胖, 强壮的女孩, 胡须,多余的腿
步数: 20, 采样器: DPM++ SDE Karras, CFG比例: 7, 种子: 2468255263, 尺寸: 512x1152, 去噪强度: 0.7, 剪辑跳过: 2
训练
基础模型:ACertainty
使用约55万张动漫风格图片(pixiv和yandere)训练了10个周期。
分辨率: 512
UCG:0.1
使用arb:是
训练器:Mikubill/naifu-diffusion
arb:
启用: 是
调试: 否
基础分辨率: [512, 512]
最大尺寸: [768, 512]
可整除: 64
最大长宽比误差: 4
最小维度: 256
维度限制: 1024
调度器:
名称: diffusers.DDIMScheduler
参数:
beta_end: 0.012
beta_schedule: "scaled_linear"
beta_start: 0.00085
clip_sample: 否
num_train_timesteps: 1000
set_alpha_to_one: 否
steps_offset: 1
trained_betas: 无
优化器:
名称: bitsandbytes.optim.AdamW8bit
参数:
学习率: 2e-6
权重衰减: 5e-2
eps: 1e-7
学习率调度器:
名称: torch.optim.lr_scheduler.CosineAnnealingWarmRestarts
预热:
启用: 是
初始学习率: 2e-8
预热步数: 50
策略: "cos"
参数:
T_0: 5
T_mult: 1
eta_min: 6e-7
last_epoch: -1
大约消耗了300个V100 GPU小时。
许可证
该模型对所有用户开放,采用CreativeML OpenRAIL-M许可证进一步规定权利和使用。
CreativeML OpenRAIL许可证规定:
- 您不能使用该模型故意生成或分享非法或有害的输出或内容
- 作者对您生成的输出不主张任何权利,您可以自由使用它们,但必须对使用负责,不得违反许可证中的规定
- 您可以重新分发权重,并将模型用于商业和/或作为服务使用。如果这样做,请注意您必须包含与许可证相同的使用限制,并向所有用户提供CreativeML OpenRAIL-M的副本(请完整仔细阅读许可证)
请在此阅读完整许可证