许可证:其他
基础模型:"black-forest-labs/FLUX.1-dev"
标签:
- flux
- flux-diffusers
- 文生图
- 图生图
- diffusers
- simpletuner
- 非全年龄向
- lora
- 模板:sd-lora
- 标准
任务标签:文生图
支持推理:是
示例:
- 文本:'无条件(空白提示)'
参数:
负面提示:'模糊、裁剪、丑陋'
输出:
图片链接:./assets/image_0_0.png
- 文本:'路虎揽胜,一辆路虎揽胜行驶在香港的高速公路上,美丽的城市景观在后方。夜晚时分,摩天大楼的霓虹灯光璀璨夺目。车头"Range Rover"字母下方是进气格栅,格栅上嵌有蓝色小徽标,写着"Land Rover"'
参数:
负面提示:'模糊、裁剪、丑陋'
输出:
图片链接:./assets/image_1_0.png
(后续示例内容保持相同结构翻译,此处省略以节省篇幅)
路虎揽胜第一阶段-2e-4-恒定值-带裁剪
这是基于black-forest-labs/FLUX.1-dev的标准PEFT LoRA模型。
训练期间未使用验证提示。
验证设置
- CFG值:
3.0
- CFG重缩放:
0.0
- 步数:
20
- 采样器:
FlowMatchEulerDiscreteScheduler
- 种子:
42
- 分辨率:
1344x768
- 跳过层引导:无
注:验证设置与训练设置不一定相同。
示例图库见:
文本编码器未参与训练,推理时可复用基础模型的文本编码器。
训练设置
-
训练周期:2
-
训练步数:10000
-
学习率:8e-05
-
最大梯度值:0.1
-
有效批次大小:3
-
梯度检查点:启用
-
预测类型:流匹配(额外参数=['shift=3.0', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all'])
-
优化器:adamw_bf16
-
可训练参数精度:纯BF16
-
基础模型精度:int8-quanto
-
标题丢弃概率:5.0%
-
LoRA秩:64
-
LoRA Alpha:无
-
LoRA丢弃率:0.1
-
LoRA初始化风格:默认
数据集
(各数据集参数翻译略,保持原技术参数不变)
推理代码
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'mipat12/rangerover-phase1-2e-4-constant-wcrops'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "宇航员骑着马穿越泰国丛林"
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1344,
height=768,
guidance_scale=3.0,
).images[0]
model_output.save("output.png", format="PNG")