K

Kandinsky 2 2 Decoder Inpaint

由 kandinsky-community 开发
Kandinsky 2.2 是一个文本生成图像的扩散模型,结合了Dall-E 2和潜在扩散模型的最佳实践,并引入了新思路。
下载量 28.23k
发布时间 : 6/16/2023
模型介绍
内容详情
替代品

模型简介

Kandinsky 2.2 采用CLIP模型作为文本和图像编码器,在CLIP模态的潜在空间之间建立扩散图像先验,提升了视觉表现力,支持图像融合和文本引导的图像处理。

模型特点

CLIP模态潜在空间映射
利用CLIP模型在文本和图像编码器之间建立扩散图像先验,增强视觉表现力
图像融合能力
支持图像融合和文本引导的图像处理
局部修复生成
支持文本引导的局部图像修复功能

模型能力

文本生成图像
图像局部修复
图像融合

使用案例

创意设计
图像局部编辑
在现有图像上添加或修改特定元素,如在猫图像上添加帽子
生成自然融合的新图像
内容创作
文本到图像生成
根据文本描述生成高质量图像
生成符合描述的视觉内容