🚀 上下文LoRA(In-Context LoRA)
上下文LoRA(In-Context LoRA)能够微调文生图模型,生成具有可定制内在关系的图像集,适用于多种任务。它为图像生成领域带来了更灵活、可控的解决方案。
🚀 快速开始
📢 [项目页面] [GitHub仓库] [论文]
🔥 最新消息
- [2024-11-16] 🌟 社区持续利用IC-LoRA进行创新!令人兴奋的项目包括用于虚拟试穿、产品设计、物体移除、角色扮演等的模型、ComfyUI节点和工作流。在**使用IC-LoRA的社区创作** 中探索他们的作品。非常感谢所有贡献者的杰出努力!
✨ 主要特性
模型概述
上下文LoRA(In-Context LoRA)对文生图模型(例如FLUX)进行微调,以生成具有可定制内在关系的图像集,还可以选择使用SDEdit以另一组图像为条件进行生成。它可以适应广泛的任务。
这个模型中心包含了涵盖10个任务的上下文LoRA模型。模型库详细介绍了这些模型及其推荐设置。有关这些模型的训练详情,请参考我们的论文。
核心思想
IC-LoRA的核心概念是将条件图像和目标图像拼接成一个复合图像,同时使用自然语言来定义任务。这种方法能够无缝适应广泛的应用场景。
特性
- 与任务无关的框架:IC-LoRA是一个通用框架,但对于不同的应用,需要进行特定任务的微调。
- 可定制的图像集生成:可以微调文生图模型,以生成具有可定制内在关系的图像集。
- 以图像集为条件:还可以以另一组图像为条件生成一组图像,从而实现广泛的可控生成应用。
如需更多详细信息和示例,请阅读我们的论文或访问我们的项目页面。
📚 详细文档
模型库
以下列出了10个上下文LoRA模型及其推荐设置。
任务 |
模型 |
推荐设置 |
示例提示 |
1. 情侣形象设计 |
couple-profile.safetensors |
width: 2048, height: 1024 |
这张两部分的图像描绘了一对穿着侦探服装的卡通猫;[左] 一只穿着风衣、戴着软毡帽的黑猫拿着放大镜向右看,而[右] 一只系着领结、戴着相配帽子的白猫好奇地扬起眉毛,在昏暗的背景下营造出一个有趣的、带有黑色电影风格的场景。 |
2. 电影分镜设计 |
film-storyboard.safetensors |
width: 1024, height: 1536 |
[电影镜头] 在一个热闹的节日里,[场景1] 我们看到 <Leo>,一个害羞的男孩,站在热闹的狂欢节边缘,对五颜六色的游乐设施和欢声笑语充满敬畏,[场景2] 过渡到他不情愿地尝试一个大胆的游戏,他的朋友们为他加油,[场景3] 最终他赢得了一只巨大的毛绒熊,他自豪地举起它让所有人看到,脸上洋溢着骄傲。 |
3. 字体设计 |
font-design.safetensors |
width: 1792, height: 1216 |
这张四格图像展示了一种俏皮的泡泡字体,采用充满活力的波普艺术风格。[左上] 以亮粉色在圆点背景上显示 “Pop Candy”;[右上] 以紫色显示 “Sweet Treat”,周围有糖果插图;[左下] 以多种亮色显示 “Yum!”;[右下] 在条纹背景上显示 “Delicious”,非常适合有趣的、适合儿童的产品。 |
4. 家居装饰 |
home-decoration.safetensors |
width: 1344, height: 1728 |
这张四格图像展示了一个质朴的客厅,有温暖的木质色调和舒适的装饰元素;[左上] 有一个大型石制壁炉,木质架子上摆满了书籍和蜡烛;[右上] 展示了一个复古皮革沙发,上面搭着格子毛毯,搭配各种纹理的靠垫;[左下] 展示了一个角落,有一把木质扶手椅,旁边的边桌上放着一杯热气腾腾的咖啡和一本经典书籍;[右下] 捕捉到一个舒适的阅读角落,有一个靠窗的座位、一条柔软的皮草披肩和整齐堆放的装饰原木。 |
5. 肖像插画 |
portrait-illustration.safetensors |
width: 1152, height: 1088 |
这张两部分的图像展示了从写实肖像到俏皮插画的转变,既捕捉到了细节又展现了艺术风格;[左] 照片中一名女子站在热闹的市场中,戴着宽边帽子,穿着飘逸的波西米亚连衣裙,背着皮革斜挎包;[右] 插画部分夸张地描绘了她的配饰和特征,波西米亚连衣裙以鲜艳的图案和大胆的颜色呈现,背景简化为抽象的市场摊位,给场景带来了生动活泼的感觉。 |
6. 肖像摄影 |
portrait-photography.safetensors |
width: 1344, height: 1728 |
这张[四格]图像展示了一位年轻艺术家在明亮而鼓舞人心的工作室中的创作过程;[左上] 她站在一块大画布前,手持画笔,为一幅未完成的画作添加鲜艳的色彩,[右上] 她坐在杂乱的木桌旁,在笔记本上勾勒想法,周围散落着各种艺术用品,[左下] 她停下来退后一步观察自己的作品,若有所思地调整眼镜,[右下] 她通过直接在调色板上混合颜料来尝试不同的纹理,她专注的表情展示了她对自己技艺的执着。 |
7. PPT模板 |
ppt-templates.safetensors |
width: 1984, height: 1152 |
这张四格图像展示了一个用于烹饪工作坊的乡村主题PowerPoint模板;[左上] 以温暖的土色调介绍 “从农场到餐桌的烹饪”;[右上] 组织工作坊部分,如 “食材”、“准备” 和 “上菜”;[左下] 显示季节性农产品的食材清单;[右下] 包括厨师简介和简短的个人资料。 |
8. 沙尘暴视觉效果 |
sandstorm-visual-effect.safetensors |
width: 1408, height: 1600 |
[沙尘暴公益广告] 这张两部分的图像展示了一名自行车手通过沙尘暴视觉效果的转变;[上] 上半部分展示了一名穿着鲜艳装备的自行车手在晴朗开阔的道路上稳步骑行,背景是宁静的天空,突出了专注和决心,[下] 下半部分将场景转变为自行车手被猛烈的沙尘暴包围,沙尘颗粒在自行车和骑手周围强烈地旋转,背景是暴风雨般的黑暗,强调了混乱和力量。 |
9. 烟花视觉效果 |
sparklers-visual-effect.safetensors |
width: 960, height: 1088 |
[真实烟花叠加效果] 这张两部分的图像生动地展示了一个森林求婚场景被烟花叠加效果改变的情景;[上] 第一部分描绘了黄昏时分,一名男子在森林空地上单膝跪地,向他的伴侣献上订婚戒指,有温暖的自然光线,[下] 第二部分引入了发光的烟花,在这对情侣周围形成一个心形,放大了这一刻的浪漫和喜悦。 |
10. 视觉形象设计 |
visual-identity-design.safetensors |
width: 1472, height: 1024 |
这张两部分的图像展示了一个农产品品牌的欢乐形象,左半部分在浅蓝色背景上展示了一个微笑的菠萝图形和品牌名称 “Fresh Tropic”,采用有趣、休闲的字体;[左] 而右半部分将设计应用到一个可重复使用的购物袋上,菠萝标志为黑色,由一名在市场环境中的人拿着,强调了品牌的平易近人和环保氛围。 |
使用上下文LoRA的社区创作
我们很高兴展示社区利用上下文LoRA(IC-LoRA)开展的创新项目。如果您有其他推荐或项目要分享,请随时发送拉取请求!
我们衷心感谢所有贡献者为推动IC-LoRA生态系统所做的杰出工作。
📄 许可证
这个模型中心使用FLUX作为基础模型。用户在使用此代码时必须遵守FLUX的许可证。有关更多详细信息,请参考FLUX的许可证。
引用
如果您在研究中发现这项工作很有用,请考虑引用:
@article{lhhuang2024iclora,
title={In-Context LoRA for Diffusion Transformers},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Shi, Yupeng and Dou, Huanzhang and Liang, Chen and Feng, Yutong and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.23775},
year={2024}
}
@article{lhhuang2024iclora,
title={Group Diffusion Transformers are Unsupervised Multitask Learners},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Dou, Huanzhang and Shi, Yupeng and Feng, Yutong and Liang, Chen and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.15027},
year={2024}
}
下载模型
这些模型的权重以Safetensors格式提供。
在“文件与版本”选项卡中下载它们。