S

Stable Diffusion 2 1

由 stabilityai 开发
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
下载量 948.75k
发布时间 : 12/6/2022
模型介绍
内容详情
替代品

模型简介

Stable Diffusion v2-1是在v2版本基础上进一步微调的文生图模型,采用潜在扩散架构和OpenCLIP文本编码器,可生成高质量图像

模型特点

高质量图像生成
基于768x768分辨率训练,可生成细节丰富的图像
安全过滤机制
训练数据经过NSFW检测器过滤(p_unsafe=0.1)
改进的微调策略
采用两阶段微调(55k步punsafe=0.1 + 155k步punsafe=0.98)
OpenCLIP文本编码
使用OpenCLIP-ViT/H作为文本编码器,增强文本理解能力

模型能力

文本生成图像
图像修改
艺术创作
设计辅助

使用案例

艺术创作
概念艺术生成
根据文字描述快速生成概念艺术图
可生成风格多样的创意图像
教育研究
生成模型研究
用于研究生成模型的局限性和偏差
可分析社会偏见在生成内容中的体现