R

Relismoilumi

由 aaronamortegui 开发
基于扩散的文本生成图像模型,支持通过文本提示生成和编辑高质量图像
下载量 181
发布时间 : 3/9/2023
模型介绍
内容详情
替代品

模型简介

Stable Diffusion v2-1是基于潜在扩散模型的文本生成图像系统,采用OpenCLIP-ViT/H作为文本编码器,支持768x768分辨率图像生成。该版本在v2基础上通过安全过滤策略进行了优化训练。

模型特点

高分辨率生成
支持最高768x768分辨率的图像生成,比前代模型有显著提升
安全过滤优化
采用punsafe参数进行分级训练,平衡生成质量与内容安全性
OpenCLIP文本编码
使用OpenCLIP-ViT/H作为文本编码器,提供更好的文本理解能力
潜在空间效率
通过8倍下采样的潜在表示空间进行扩散,大幅降低计算资源需求

模型能力

文本生成图像
图像编辑
艺术创作
设计辅助

使用案例

创意设计
概念艺术创作
为游戏/影视行业快速生成概念艺术图
可快速迭代多种设计风格
平面设计
生成广告、海报等设计素材
提供高质量基础素材
教育研究
生成模型研究
研究生成模型的局限性与偏差
可用于学术论文实验
教学演示
展示AI生成艺术的技术原理
生动直观的教学工具