S

Stable Diffusion V1 5 Inpainting

由 botp 开发
基于潜在扩散架构的文本生成图像模型,具备通过遮罩修复图像的增强功能
下载量 6,191
发布时间 : 5/5/2023
模型介绍
内容详情
替代品

模型简介

该模型不仅能根据文本输入生成逼真图像,还能通过遮罩对图像进行智能修复。基于Stable-Diffusion-v-1-2权重初始化,新增5个输入通道用于处理遮罩信息。

模型特点

双重功能
同时支持文本生成图像和基于遮罩的图像修复
增强训练
在LAION数据集上追加44万步修复专项训练,采用10%文本条件丢弃优化
遮罩处理优化
UNet新增5个专用输入通道,25%训练样本使用全遮罩增强鲁棒性

模型能力

文本引导图像生成
图像修复与编辑
高分辨率图像合成
艺术创作辅助

使用案例

创意设计
概念艺术生成
根据文字描述快速生成设计概念图
512x512分辨率图像,支持多次迭代优化
图像编辑
智能修图
通过遮罩自动修复照片缺陷或移除不需要的元素
FID 1.00,LPIPS 0.141(优于LaMa等专业修复模型)