T

Torben

由 scheissegalo 开发
基于文本生成图像的潜在扩散模型,能够根据文本输入生成逼真图像
下载量 14
发布时间 : 11/17/2022
模型介绍
内容详情
替代品

模型简介

Stable-Diffusion-v1-5是基于v1-2权重在laion-aesthetics v2 5+数据集上微调的文本到图像生成模型,支持512x512分辨率图像生成,采用潜在扩散模型架构和CLIP ViT-L/14文本编码器

模型特点

高分辨率图像生成
支持512x512分辨率的高质量图像生成
无分类器引导采样
采用10%文本条件丢弃技术优化采样过程
商业友好许可
允许商用及服务化用途的权重再分发
潜在空间处理
在潜在空间而非像素空间进行扩散过程,提高效率

模型能力

文本生成图像
艺术创作
设计辅助
教育工具开发

使用案例

艺术创作
概念艺术生成
根据文字描述快速生成概念艺术图像
可用于游戏、电影前期概念设计
教育工具
创意教学辅助
将抽象概念可视化辅助教学
增强教学互动性和趣味性