许可协议: 其他
基础模型: "black-forest-labs/FLUX.1-dev"
标签:
- flux
- flux-diffusers
- 文本生成图像
- 图像生成图像
- diffusers
- simpletuner
- 非全年龄段适用
- lora
- 模板:sd-lora
- 标准
管道标签: 文本生成图像
推理: 是
小部件示例:
- 文本: '无条件(空白提示)'
参数:
负面提示: ''
输出:
链接: ./assets/image_0_0.png
- 文本: '照片:$kora猫在窗台上睡觉。'
参数:
负面提示: ''
输出:
链接: ./assets/image_1_0.png
flux-lora训练模型
这是一个基于black-forest-labs/FLUX.1-dev的标准PEFT LoRA衍生模型。
训练期间使用的主要验证提示词为:
照片:$kora猫在窗台上睡觉。
验证设置
- CFG值:
3.5
- CFG重缩放:
0.0
- 步数:
15
- 采样器:
FlowMatchEulerDiscreteScheduler
- 种子:
42
- 分辨率:
1024x1024
- 跳过层引导:
注:验证设置不一定与训练设置相同。
您可以在下方图库查看示例图片:
文本编码器未参与训练。
推理时可复用基础模型的文本编码器。
训练设置
-
训练周期: 384
-
训练步数: 5000
-
学习率: 0.0001
- 学习率计划: 带热身的恒定学习率
- 热身步数: 100
-
最大梯度值: 1.0
-
有效批次大小: 4
- 微批次大小: 4
- 梯度累积步数: 1
- GPU数量: 1
-
梯度检查点: 启用
-
预测类型: 流匹配(额外参数=['flow_schedule_auto_shift', 'shift=0.0', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all+ffs'])
-
优化器: adamw_bf16
-
可训练参数精度: 纯BF16
-
基础模型精度: 保持不变
-
标题丢弃概率: 0.0%
-
LoRA秩: 16
-
LoRA Alpha: 无
-
LoRA丢弃率: 0.1
-
LoRA初始化风格: 默认
数据集
kora图像数据
- 重复次数: 0
- 总图像数: 50
- 总宽高比分桶数: 1
- 分辨率: 1.048576百万像素
- 已裁剪: 是
- 裁剪方式: 居中
- 裁剪比例: 正方形
- 是否用于正则化数据: 否
推理
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'Forezeztgump/flux-lora-training'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "照片:$kora猫在窗台上睡觉。"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
num_inference_steps=15,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=3.5,
).images[0]
model_output.save("output.png", format="PNG")