In-Context-LoRA开源文生图模型 - 微调生成自定义图像组，适配多场景

首页

In Context LoRA

由 ckpt 开发

通过微调文生图模型（如FLUX），可生成具有自定义内在关联的图像组，并支持基于SDEdit的跨图像组条件生成。该技术能适配多种任务场景。

图像生成开源协议:MIT #多图关联生成 #跨图像条件控制 #任务自适应微调

下载量 216

发布时间 : 11/16/2024

模型简介

上下文LoRA是一种基于LoRA（低秩适应）技术的文本到图像生成模型，通过微调基础扩散模型（如FLUX），能够生成具有特定关联规则的图像组，并支持跨图像组的条件控制生成。

模型特点

任务无关框架

作为通用框架，可针对不同任务进行专项微调

可定制图像组生成

可微调模型生成具有特定关联规则的图像组

跨图像组条件控制

支持基于一组图像生成另一组关联图像，实现可控生成

自然语言定义任务关系

通过拼接条件图像与目标图像形成组合图像，同时使用自然语言定义任务关系

模型能力

情侣头像设计

电影分镜生成

字体设计

家居装饰设计

肖像插画生成

人像摄影风格转换

PPT模板设计

沙尘暴特效生成

烟花特效生成

视觉识别设计

使用案例

创意设计

情侣头像设计

生成风格统一的情侣卡通或写实头像

双联画形式的匹配头像，如示例中的卡通猫侦探情侣

字体设计

生成具有统一风格的创意字体

四联画展示的波普艺术风格泡泡字体

影视制作

电影分镜

生成连贯的电影场景分镜

1024×1536分辨率的三场景分镜，如示例中的节日场景

商业设计

PPT模板设计

生成风格统一的演示文稿模板

四联烹饪课PPT模板，采用大地色系设计

视觉识别设计

生成品牌视觉识别系统元素

双联品牌设计，包含图标和帆布袋应用

🚀 上下文LoRA（In-Context LoRA）

上下文LoRA（In-Context LoRA）能够微调文生图模型，生成具有可定制内在关系的图像集，适用于多种任务。它为图像生成领域带来了更灵活、可控的解决方案。

🚀 快速开始

📢 [项目页面] [GitHub仓库] [论文]

🔥 最新消息

[2024-11-16] 🌟 社区持续利用IC-LoRA进行创新！令人兴奋的项目包括用于虚拟试穿、产品设计、物体移除、角色扮演等的模型、ComfyUI节点和工作流。在**使用IC-LoRA的社区创作** 中探索他们的作品。非常感谢所有贡献者的杰出努力！

✨ 主要特性

模型概述

上下文LoRA（In-Context LoRA）对文生图模型（例如FLUX）进行微调，以生成具有可定制内在关系的图像集，还可以选择使用SDEdit以另一组图像为条件进行生成。它可以适应广泛的任务。

这个模型中心包含了涵盖10个任务的上下文LoRA模型。模型库详细介绍了这些模型及其推荐设置。有关这些模型的训练详情，请参考我们的论文。

核心思想

IC-LoRA的核心概念是将条件图像和目标图像拼接成一个复合图像，同时使用自然语言来定义任务。这种方法能够无缝适应广泛的应用场景。

特性

与任务无关的框架：IC-LoRA是一个通用框架，但对于不同的应用，需要进行特定任务的微调。
可定制的图像集生成：可以微调文生图模型，以生成具有可定制内在关系的图像集。
以图像集为条件：还可以以另一组图像为条件生成一组图像，从而实现广泛的可控生成应用。

如需更多详细信息和示例，请阅读我们的论文或访问我们的项目页面。

📚 详细文档

模型库

以下列出了10个上下文LoRA模型及其推荐设置。

任务	模型	推荐设置	示例提示
1. 情侣形象设计	couple-profile.safetensors	`width: 2048, height: 1024`	`这张两部分的图像描绘了一对穿着侦探服装的卡通猫；[左] 一只穿着风衣、戴着软毡帽的黑猫拿着放大镜向右看，而[右] 一只系着领结、戴着相配帽子的白猫好奇地扬起眉毛，在昏暗的背景下营造出一个有趣的、带有黑色电影风格的场景。`
2. 电影分镜设计	film-storyboard.safetensors	`width: 1024, height: 1536`	`[电影镜头] 在一个热闹的节日里，[场景1] 我们看到 <Leo>，一个害羞的男孩，站在热闹的狂欢节边缘，对五颜六色的游乐设施和欢声笑语充满敬畏，[场景2] 过渡到他不情愿地尝试一个大胆的游戏，他的朋友们为他加油，[场景3] 最终他赢得了一只巨大的毛绒熊，他自豪地举起它让所有人看到，脸上洋溢着骄傲。`
3. 字体设计	font-design.safetensors	`width: 1792, height: 1216`	`这张四格图像展示了一种俏皮的泡泡字体，采用充满活力的波普艺术风格。[左上] 以亮粉色在圆点背景上显示 “Pop Candy”；[右上] 以紫色显示 “Sweet Treat”，周围有糖果插图；[左下] 以多种亮色显示 “Yum!”；[右下] 在条纹背景上显示 “Delicious”，非常适合有趣的、适合儿童的产品。`
4. 家居装饰	home-decoration.safetensors	`width: 1344, height: 1728`	这张四格图像展示了一个质朴的客厅，有温暖的木质色调和舒适的装饰元素；[左上] 有一个大型石制壁炉，木质架子上摆满了书籍和蜡烛；[右上] 展示了一个复古皮革沙发，上面搭着格子毛毯，搭配各种纹理的靠垫；[左下] 展示了一个角落，有一把木质扶手椅，旁边的边桌上放着一杯热气腾腾的咖啡和一本经典书籍；[右下] 捕捉到一个舒适的阅读角落，有一个靠窗的座位、一条柔软的皮草披肩和整齐堆放的装饰原木。
5. 肖像插画	portrait-illustration.safetensors	`width: 1152, height: 1088`	`这张两部分的图像展示了从写实肖像到俏皮插画的转变，既捕捉到了细节又展现了艺术风格；[左] 照片中一名女子站在热闹的市场中，戴着宽边帽子，穿着飘逸的波西米亚连衣裙，背着皮革斜挎包；[右] 插画部分夸张地描绘了她的配饰和特征，波西米亚连衣裙以鲜艳的图案和大胆的颜色呈现，背景简化为抽象的市场摊位，给场景带来了生动活泼的感觉。`
6. 肖像摄影	portrait-photography.safetensors	`width: 1344, height: 1728`	这张[四格]图像展示了一位年轻艺术家在明亮而鼓舞人心的工作室中的创作过程；[左上] 她站在一块大画布前，手持画笔，为一幅未完成的画作添加鲜艳的色彩，[右上] 她坐在杂乱的木桌旁，在笔记本上勾勒想法，周围散落着各种艺术用品，[左下] 她停下来退后一步观察自己的作品，若有所思地调整眼镜，[右下] 她通过直接在调色板上混合颜料来尝试不同的纹理，她专注的表情展示了她对自己技艺的执着。
7. PPT模板	ppt-templates.safetensors	`width: 1984, height: 1152`	`这张四格图像展示了一个用于烹饪工作坊的乡村主题PowerPoint模板；[左上] 以温暖的土色调介绍 “从农场到餐桌的烹饪”；[右上] 组织工作坊部分，如 “食材”、“准备” 和 “上菜”；[左下] 显示季节性农产品的食材清单；[右下] 包括厨师简介和简短的个人资料。`
8. 沙尘暴视觉效果	sandstorm-visual-effect.safetensors	`width: 1408, height: 1600`	`[沙尘暴公益广告] 这张两部分的图像展示了一名自行车手通过沙尘暴视觉效果的转变；[上] 上半部分展示了一名穿着鲜艳装备的自行车手在晴朗开阔的道路上稳步骑行，背景是宁静的天空，突出了专注和决心，[下] 下半部分将场景转变为自行车手被猛烈的沙尘暴包围，沙尘颗粒在自行车和骑手周围强烈地旋转，背景是暴风雨般的黑暗，强调了混乱和力量。`
9. 烟花视觉效果	sparklers-visual-effect.safetensors	`width: 960, height: 1088`	`[真实烟花叠加效果] 这张两部分的图像生动地展示了一个森林求婚场景被烟花叠加效果改变的情景；[上] 第一部分描绘了黄昏时分，一名男子在森林空地上单膝跪地，向他的伴侣献上订婚戒指，有温暖的自然光线，[下] 第二部分引入了发光的烟花，在这对情侣周围形成一个心形，放大了这一刻的浪漫和喜悦。`
10. 视觉形象设计	visual-identity-design.safetensors	`width: 1472, height: 1024`	`这张两部分的图像展示了一个农产品品牌的欢乐形象，左半部分在浅蓝色背景上展示了一个微笑的菠萝图形和品牌名称 “Fresh Tropic”，采用有趣、休闲的字体；[左] 而右半部分将设计应用到一个可重复使用的购物袋上，菠萝标志为黑色，由一名在市场环境中的人拿着，强调了品牌的平易近人和环保氛围。`

使用上下文LoRA的社区创作

我们很高兴展示社区利用上下文LoRA（IC-LoRA）开展的创新项目。如果您有其他推荐或项目要分享，请随时发送拉取请求!

项目名称	类型	支持的任务
1. Comfyui_Object_Migration	ComfyUI节点、工作流和LoRA模型	服装迁移、卡通服装写实化等
2. Flux Simple Try On - In Context Lora	LoRA模型和ComfyUI工作流	虚拟试穿
3. Flux In Context - visual identity Lora in Comfy	ComfyUI工作流	视觉形象转移
4. Workflows Flux In Context Lora For Product Design	ComfyUI工作流	产品设计、角色扮演等
5. Flux Product Design - In Context Lora	LoRA模型和ComfyUI工作流	产品设计
6. In Context lora + Character story generator + flux+ shichen	ComfyUI工作流	角色电影故事生成
7. In- Context-Lora｜Cute 4koma 可爱四格漫画	LoRA模型和ComfyUI工作流	漫画条生成
8. Creative Effects & Design LoRA Pack (In-Context LORA)	LoRA模型和ComfyUI工作流	电影镜头生成等

我们衷心感谢所有贡献者为推动IC-LoRA生态系统所做的杰出工作。

📄 许可证

这个模型中心使用FLUX作为基础模型。用户在使用此代码时必须遵守FLUX的许可证。有关更多详细信息，请参考FLUX的许可证。

引用

如果您在研究中发现这项工作很有用，请考虑引用：

@article{lhhuang2024iclora,
  title={In-Context LoRA for Diffusion Transformers},
  author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Shi, Yupeng and Dou, Huanzhang and Liang, Chen and Feng, Yutong and Liu, Yu and Zhou, Jingren},
  journal={arXiv preprint arxiv:2410.23775},
  year={2024}
}

@article{lhhuang2024iclora,
  title={Group Diffusion Transformers are Unsupervised Multitask Learners},
  author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Dou, Huanzhang and Shi, Yupeng and Feng, Yutong and Liang, Chen and Liu, Yu and Zhou, Jingren},
  journal={arXiv preprint arxiv:2410.15027},
  year={2024}
}