D

Diffusers Inpainting Text Box

由 gligen 开发
Stable Diffusion 是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
下载量 130
发布时间 : 3/11/2023
模型介绍
内容详情
替代品

模型简介

基于扩散的文本生成图像模型,采用潜在扩散模型架构,支持从文本描述生成高质量图像。

模型特点

高质量图像生成
能够根据文本输入生成高分辨率(512x512)的逼真图像
分类器无关引导采样
采用10%文本条件丢弃优化,提升生成质量
内存优化
支持注意力切片技术,可在小于4GB显存的GPU上运行
多平台支持
支持PyTorch和JAX/Flax框架,可在GPU/TPU上运行

模型能力

文本到图像生成
艺术创作
设计辅助
创意可视化

使用案例

艺术创作
概念艺术生成
根据文字描述快速生成概念艺术图像
可用于游戏、电影等前期概念设计
风格化图像创作
结合不同艺术风格提示词生成独特图像
如迪士尼风格、赛博朋克风格等
教育研究
生成模型研究
探索生成模型的局限性和可能性
用于学术研究和实验
创意工具开发
基于模型开发创意辅助工具
如设计辅助应用、艺术创作工具等