标签:
- 文本到图像
- LoRA(低秩适应)
- 扩散模型
- 模板:扩散-LoRA
基础模型: black-forest-labs/FLUX.1-dev
实例提示: 无
许可证: MIT
📢 [项目主页] [GitHub仓库] [论文]
🔥 最新动态
- [2024-12-17] 🚀 我们隆重发布 IDEA-Bench,这是一个全面评估生成模型零样本任务泛化能力的基准测试。该基准包含100个现实设计任务,涵盖275个独特案例。尽管面向通用场景,当前最佳模型EMU2仅获得6.81分(满分100),凸显了该领域的挑战性。快来探索基准,挑战模型性能极限!
- [2024-11-16] 🌟 社区持续创新IC-LoRA应用!精彩项目包括虚拟试穿、产品设计、物体迁移、角色扮演等领域的模型、ComfyUI节点和工作流。查看**社区创意作品**。衷心感谢所有贡献者的卓越努力!
社区IC-LoRA创意作品
我们欣喜展示社区基于上下文LoRA(IC-LoRA)的创新项目。如有推荐或作品分享,欢迎提交Pull Request!
衷心感谢所有推动IC-LoRA生态发展的贡献者。
模型概述
上下文LoRA通过微调文生图模型(如FLUX)生成具有可定制内在关联的图像组,支持基于SDEdit的图像组条件生成,可适配多种任务。
本模型库包含10个任务的IC-LoRA模型,模型库详述各模型及推荐参数。训练方法详见论文。
核心思想
IC-LoRA通过拼接条件图像与目标图像为复合图像,并采用自然语言定义任务,实现广泛应用的灵活适配。
特性
- 任务无关框架:通用框架需针对不同任务微调
- 可定制图像组生成:生成具有特定关联规则的图像组
- 图像组条件控制:支持基于图像组的条件生成
更多细节请参阅论文或项目主页。
模型库
下表列出10个IC-LoRA模型及推荐参数。
任务 |
模型 |
推荐参数 |
示例提示词 |
1. 情侣头像设计 |
couple-profile.safetensors |
宽:2048, 高:1024 |
这幅双联画展现侦探装扮的卡通猫情侣;[左]穿风衣戴软呢帽的黑猫持放大镜向右凝视,[右]戴领结的白猫挑眉露出好奇表情,在暗调背景中营造趣味黑色电影场景 |
2. 电影分镜 |
film-storyboard.safetensors |
宽:1024, 高:1536 |
[电影镜头]在热闹节日中,[场景1]害羞的<Leo>站在熙攘嘉年华边缘,对五彩设施露出惊叹神情;[场景2]展现他勉强尝试冒险游戏时朋友加油;[场景3]高潮是他赢得巨型毛绒熊时骄傲高举的灿烂笑容 |
3. 字体设计 |
font-design.safetensors |
宽:1792, 高:1216 |
四联画展示波普艺术风格的泡泡字体:[左上]粉红"Pop Candy"带圆点背景;[右上]紫色"Sweet Treat"环绕糖果图案;[左下]多彩"Yum!";[右下]条纹背景的"Delicious",适合儿童产品 |
4. 家居装饰 |
home-decoration.safetensors |
宽:1344, 高:1728 |
四联乡村客厅设计:[左上]石砌壁炉配木质书架;[右上]复古皮沙发搭格纹毯;[左下]木椅旁放热饮的边桌;[右下]带毛毯的飘窗阅读角 |
5. 肖像插画 |
portrait-illustration.safetensors |
宽:1152, 高:1088 |
双联肖像转插画:[左]戴宽檐帽穿波西米亚裙的女性市集实拍;[右]夸张配饰与鲜艳图案的动画风格插画 |
6. 人像摄影 |
portrait-photography.safetensors |
宽:1344, 高:1728 |
[四联]艺术家创作过程:[左上]画布前执笔;[右上]桌前草图构思;[左下]扶镜观察;[右下]调色板混色实验 |
7. PPT模板 |
ppt-templates.safetensors |
宽:1984, 高:1152 |
四联烹饪课PPT:[左上]"农场到餐桌"标题;[右上]课程模块;[左下]时令食材;[右下]厨师简介 |
8. 沙尘暴特效 |
sandstorm-visual-effect.safetensors |
宽:1408, 高:1600 |
[沙尘暴警示]双联骑行对比:[上]晴朗道路专注骑行;[下]沙暴中艰难前行的混沌场景 |
9. 火花特效 |
sparklers-visual-effect.safetensors |
宽:960, 高:1088 |
[真实火花叠加]双联求婚场景:[上]黄昏森林单膝跪地;[下]心形火花环绕的浪漫时刻 |
10. 视觉识别设计 |
visual-identity-design.safetensors |
宽:1472, 高:1024 |
双联品牌设计:[左]浅蓝底上的微笑菠萝标志;[右]市集场景中黑色logo环保袋 |
许可证
本模型库基于FLUX基础模型,使用时需遵守FLUX许可证。
引用
若研究工作使用本成果,请引用:
@article{lhhuang2024iclora,
title={In-Context LoRA for Diffusion Transformers},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Shi, Yupeng and Dou, Huanzhang and Liang, Chen and Feng, Yutong and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.23775},
year={2024}
}
@article{lhhuang2024iclora,
title={Group Diffusion Transformers are Unsupervised Multitask Learners},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Dou, Huanzhang and Shi, Yupeng and Feng, Yutong and Liang, Chen and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.15027},
year={2024}
}
模型下载
模型权重为Safetensors格式,请在文件版本页下载。