许可证: 其他
基础模型: "black-forest-labs/FLUX.1-dev"
标签:
- flux
- flux-diffusers
- 文本生成图像
- diffusers
- simpletuner
- lora
- 模板:sd-lora
- 标准
推理: 是
小部件:
- 文本: '无条件(空白提示)'
参数:
负面提示: '模糊、裁剪、丑陋'
输出:
链接: ./assets/image_0_0.png
- 文本: '为赛车游戏应用生成一个标志'
参数:
负面提示: '模糊、裁剪、丑陋'
输出:
链接: ./assets/image_1_0.png
标志-LoRA
这是一个标准的PEFT LoRA,源自black-forest-labs/FLUX.1-dev。
训练期间使用的主要验证提示为:
为赛车游戏应用生成一个标志
验证设置
- CFG:
3.0
- CFG 重缩放:
0.0
- 步数:
20
- 采样器:
FlowMatchEulerDiscreteScheduler
- 种子:
42
- 分辨率:
512
- 跳过层引导:
注意:验证设置不一定与训练设置相同。
你可以在以下图库中找到一些示例图像:
文本编码器未进行训练。
你可以复用基础模型的文本编码器进行推理。
训练设置
-
训练周期: 0
-
训练步数: 2600
-
学习率: 8e-05
-
最大梯度范数: 2.0
-
有效批次大小: 1
- 微批次大小: 1
- 梯度累积步数: 1
- GPU数量: 1
-
梯度检查点: 是
-
预测类型: 流匹配(额外参数=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all'])
-
优化器: adamw_bf16
-
可训练参数精度: 纯BF16
-
标题丢弃概率: 5.0%
-
LoRA 秩: 64
-
LoRA Alpha: 无
-
LoRA 丢弃率: 0.1
-
LoRA 初始化风格: 默认
数据集
app_data
- 重复次数: 4
- 总图像数: 10001
- 总宽高比分桶数: 1
- 分辨率: 0.262144 百万像素
- 裁剪: 否
- 裁剪风格: 无
- 裁剪宽高比: 无
- 用于正则化数据: 否
推理
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'brianling16/logo-lora'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "为赛车游戏应用生成一个标志"
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=512,
height=512,
guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")