1

14t6

由 ismot 开发
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
下载量 24
发布时间 : 1/14/2023
模型介绍
内容详情
替代品

模型简介

Stable Diffusion v2-1是在v2版本基础上进一步微调的潜在扩散模型,采用OpenCLIP-ViT/H文本编码器,支持高分辨率图像生成

模型特点

高分辨率生成
支持768x768分辨率图像生成,质量优于前代模型
安全训练
采用p_unsafe=0.1的保守阈值过滤训练数据,减少有害内容生成
多框架支持
兼容diffusers库和原生stablediffusion代码库
微调优化
在v2基础上额外训练210k步(55k保守步+155k开放步)

模型能力

文本到图像生成
图像修改
艺术创作
设计辅助

使用案例

艺术创作
概念艺术生成
根据文字描述快速生成概念艺术图
可生成多种风格的概念设计图
教育研究
生成模型研究
用于研究生成模型的局限性和偏差
创意工具
设计原型生成
快速生成产品设计原型图