K

Kandinsky 2 1 Inpaint

由 kandinsky-community 开发
康定斯基2.1是基于Dall-E 2和潜在扩散模型最佳实践的文本生成图像模型,采用CLIP作为文本与图像编码器,提升了视觉表现力。
下载量 2,268
发布时间 : 5/24/2023
模型介绍
内容详情
替代品

模型简介

该模型结合了CLIP多模态潜在空间的扩散图像先验技术,支持文本引导的图像生成与修复,适用于创意图像合成任务。

模型特点

多模态潜在空间映射
通过CLIP建立文本与图像编码的潜在空间映射,增强视觉表现力
图像融合能力
支持文本引导的图像操控和内容融合
高分辨率训练
基于≥768x768分辨率的1.7亿高质量图像对训练

模型能力

文本生成图像
图像修复
文本引导的图像编辑
图像插值

使用案例

创意设计
概念艺术生成
根据文字描述生成创意概念图
示例展示了为猫添加帽子的图像修复效果
内容编辑
图像元素替换
通过遮罩和文本提示修改图像局部内容
可精确控制修改区域并保持背景连贯