标签:
- 文本到图像
- LoRA(低秩适应)
- 扩散模型
- 模板:扩散-LoRA
基础模型: black-forest-labs/FLUX.1-dev
实例提示: 无
许可证: MIT
📢 [项目主页] [GitHub仓库] [论文]
🔥 最新动态
- [2024-11-16] 🌟 社区持续创新IC-LoRA应用!涌现了包括虚拟试衣、产品设计、物体迁移、角色扮演等领域的模型、ComfyUI节点和工作流。探索这些创意成果请见**社区创作案例**。衷心感谢所有贡献者的卓越努力!
模型概述
上下文LoRA(In-Context LoRA)通过微调文生图模型(如FLUX),可生成具有自定义内在关联的图像组,并支持基于SDEdit的跨图像组条件生成。该技术能适配多种任务场景。
本模型库包含10个任务的上下文LoRA模型。模型库详细列出了各模型及其推荐配置。训练方法细节请参阅我们的论文。
核心思想
IC-LoRA通过拼接条件图像与目标图像形成组合图像,同时使用自然语言定义任务关系。这种设计实现了对不同应用的灵活适配。
技术特性
- 任务无关框架:作为通用框架,但需针对不同任务进行专项微调
- 可定制图像组生成:可微调模型生成具有特定关联规则的图像组
- 跨图像组条件控制:支持基于一组图像生成另一组关联图像,实现可控生成
更多技术细节和案例请阅读论文或访问项目主页。
模型库
下表列出10个IC-LoRA模型及其推荐配置:
任务 |
模型 |
推荐设置 |
示例提示语 |
1. 情侣头像设计 |
couple-profile.safetensors |
宽度:2048, 高度:1024 |
这幅双联画展示卡通猫侦探情侣:左侧黑猫身着风衣戴软呢帽,手持放大镜向右凝视;右侧白猫系领结戴同款帽子挑眉好奇,在暗调背景中构成趣味黑色电影场景。 |
2. 电影分镜 |
film-storyboard.safetensors |
宽度:1024, 高度:1536 |
[电影镜头] 在热闹节日中,[场景1]害羞男孩<Leo>站在狂欢节边缘,瞪大眼睛望着缤纷设施;[场景2]朋友们鼓励下他尝试挑战游戏;[场景3]最终他赢得巨型泰迪熊,骄傲高举战利品。 |
3. 字体设计 |
font-design.safetensors |
宽度:1792, 高度:1216 |
四联画展示波普艺术风格泡泡字体:左上角"Pop Candy"配粉色波点背景;右上角"Sweet Treat"紫色字体环绕糖果图案;左下角"Yum!"采用彩虹色;右下角"Delicious"搭配条纹背景,适合儿童产品。 |
4. 家居装饰 |
home-decoration.safetensors |
宽度:1344, 高度:1728 |
四联乡村风格客厅:左上石砌壁炉配木质书架;右上复古皮沙发铺格纹毯;左下木椅旁侧桌摆热饮与书籍;右下飘窗阅读角铺毛毯,展现温暖氛围。 |
5. 肖像插画 |
portrait-illustration.safetensors |
宽度:1152, 高度:1088 |
双联肖像转化:左侧写实照片展示集市中戴宽檐帽的波西米亚风格女性;右侧插画强化服饰图案与色彩,背景简化为抽象摊位,呈现动画质感。 |
6. 人像摄影 |
portrait-photography.safetensors |
宽度:1344, 高度:1728 |
[四联画]记录艺术家创作过程:左上执笔绘制油画;右上在堆满素材的木桌草图;左下扶眼镜审视作品;右下调色盘混色实验,展现专注神态。 |
7. PPT模板 |
ppt-templates.safetensors |
宽度:1984, 高度:1152 |
四联烹饪课PPT模板:左上"从农场到餐桌"标题;右上分"食材/准备/摆盘"模块;左下时令食材清单;右下厨师简介,采用大地色系设计。 |
8. 沙尘暴特效 |
sandstorm-visual-effect.safetensors |
宽度:1408, 高度:1600 |
[沙尘暴警示] 双联对比:上幅骑行者晴空下稳定前行;下幅沙暴肆虐,颗粒环绕车手,背景转为昏暗风暴,突显环境巨变。 |
9. 烟花特效 |
sparklers-visual-effect.safetensors |
宽度:960, 高度:1088 |
[真实烟花叠加] 上幅黄昏森林求婚场景;下幅添加心形火花环绕情侣,强化浪漫氛围。 |
10. 视觉识别设计 |
visual-identity-design.safetensors |
宽度:1472, 高度:1024 |
双联品牌设计:左幅浅蓝底微笑菠萝图标与"Fresh Tropic"名称;右幅同图案黑色版帆布袋,展现环保亲民理念。 |
社区创作案例
我们欣喜展示社区基于IC-LoRA的创新项目。如有推荐项目,欢迎提交Pull Request!
衷心感谢所有推动IC-LoRA生态发展的贡献者。
许可证
本模型库基于FLUX模型,使用时需遵守FLUX许可证。
引用
若研究工作使用本成果,请引用:
@article{lhhuang2024iclora,
title={In-Context LoRA for Diffusion Transformers},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Shi, Yupeng and Dou, Huanzhang and Liang, Chen and Feng, Yutong and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.23775},
year={2024}
}
@article{lhhuang2024iclora,
title={Group Diffusion Transformers are Unsupervised Multitask Learners},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Dou, Huanzhang and Shi, Yupeng and Feng, Yutong and Liang, Chen and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.15027},
year={2024}
}
模型下载
模型权重为Safetensors格式,请在文件版本页下载。