标签:
- 文本到图像
- LoRA
- 扩散模型
- 模板:扩散-LoRA
微件:
- 文本: '卡通混合风格,一位中长发女性,身着白衬衫和深色比基尼,腰间系着白色围巾。她手持灰色瓶子,右手叉腰,左手环绕瓶身,为整体增添一抹亮色。头戴粉色遮阳帽,棕色长发垂落肩头。背景是嶙峋的悬崖峭壁,与点缀白色星辰的蔚蓝天空形成强烈对比。'
输出:
网址: images/T1.png
- 文本: '卡通混合风格,一顶鲜艳的橙色帽子戴在女子头顶。她棕色的长发垂落肩头,衬托着脸庞。身穿黑色夹克,搭配亮橙色围巾和黄色背包。背景虚化,街道上停着几辆汽车,为画面增添色彩。'
输出:
网址: images/T2.png
- 文本: '卡通混合风格,特写镜头下,一位棕色长发女子戴着灰色针织帽和黑色夹克。她嘴里叼着白色耳机,为面部增添亮点。帽子上的黑白斑点图案遮住了部分脸庞,帽檐上方写着蓝色的"FRIORY"字样。一只手高举帽子,另一只手伸向镜头。背景中,建筑物玻璃映出女子的倒影,增强了画面纵深感。'
输出:
网址: images/T3.png
- 文本: '卡通混合风格,平视视角的中景镜头捕捉一位亚裔年轻女性。她留着深棕色长发,穿着白色背心和灰黑格子衬衫。面部装饰着黑白抽象画作,为单色调场景增添色彩。站在青草地上,背景是树木和澄澈蓝天。'
输出:
网址: images/T4.png
- 文本: '卡通混合风格:金色及肩短发的年轻女性穿着淡蓝色连衣裙,系白色腰带。右手拿着草编遮阳帽,左手轻搭腰间。佩戴金色手链和精致项链。背景是宁静海滩,轻柔浪花与金色落日为场景增添温暖光晕。'
输出:
网址: images/T5.png
- 文本: '卡通混合风格,高挑的金发男子穿着卷袖白衬衫和浅蓝牛仔裤。右臂夹着滑板,板面有红色涂鸦。站在混凝土人行道上,背景是涂鸦砖墙。落日投下修长阴影,墙上的鸽子为画面增添趣味。'
输出:
网址: images/T6.png
- 文本: '卡通混合风格,顽皮笑容的刺猬头黑发男孩歪戴红色棒球帽,穿着亮黄色连帽衫和破洞牛仔裤。骑着鲜绿色自行车行驶在鹅卵石路上,周围散落彩色秋叶。背景是热闹公园,有家庭、狗狗和荡秋千的孩子们。'
输出:
网址: images/T7.png
- 文本: '卡通混合风格,轮廓分明的灰白发高个男子穿着定制海军蓝西装和酒红色领带。站在鹅卵石街道的发光路灯下,手持黑伞抵挡细雨。身后巴黎风格咖啡馆的露天座位营造精致氛围,隐约的爵士乐声仿佛飘荡在场景中。'
输出:
网址: images/T8.png
- 文本: '卡通混合风格:黑色短发的年轻男子穿着蓝色牛仔外套和白T恤,坐在木制长椅上。双手捧着热气腾腾的咖啡,颈间围着鲜艳红围巾。放松的姿势与繁忙城市背景形成对比,摩天大楼与落日橙晖交相辉映。'
输出:
网址: images/T9.png
基础模型: black-forest-labs/FLUX.1-dev
触发词: 卡通混合
许可证: creativeml-openrail-m
Flux.1开发版-实时卡通混合
该模型仍处于训练阶段。非最终版本,可能存在伪影或在某些情况下表现欠佳。
模型描述
prithivMLmods/Flux.1-Dev-Realtime-Toon-Mix
图像处理参数
参数 |
值 |
参数 |
值 |
学习率调度器 |
恒定 |
噪声偏移 |
0.03 |
优化器 |
AdamW |
多分辨率噪声衰减 |
0.1 |
网络维度 |
64 |
多分辨率噪声迭代次数 |
10 |
网络Alpha值 |
32 |
重复次数与训练步数 |
17 & 2900 |
训练轮次 |
15 |
每N轮保存 |
1 |
标注系统: florence2-en(自然语言&英语)
训练用图像总数: 29张
最佳尺寸
- 768 x 1024 (最佳)
- 1024 x 1024 (默认)
环境配置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux.1-Dev-Realtime-Toon-Mix"
trigger_word = "卡通混合"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发词
需使用卡通混合
触发图像生成。
模型下载
本模型权重提供Safetensors格式。
在文件与版本选项卡中下载。