D

Doohickey Mega

由 doohickey 开发
专为高分辨率图像合成优化的稳定扩散模型系列,基于Stable Diffusion v1-5微调,支持多种分辨率比例
下载量 186
发布时间 : 11/12/2022
模型介绍
内容详情
替代品

模型简介

基于runwayml/stable-diffusion-v1-5微调的文本到图像生成模型,特别优化了768x768分辨率附近的图像合成质量,支持多种比例输出

模型特点

高分辨率优化
专门针对768x768分辨率附近进行微调,生成高质量图像
多种比例支持
支持640x640至768x768多种输出比例(如768x640/704x768)
手部细节优化
v3-6000及后续版本特别优化了手部细节表现
改进的CLIP模型
v3版本采用laion/CLIP-ViT-L-14-laion2B-s32B-b82K模型并同步微调

模型能力

文本到图像生成
高分辨率图像合成
多种比例图像生成

使用案例

创意设计
概念艺术创作
根据文本描述生成高分辨率概念艺术图像
768x768分辨率的高质量艺术作品
数字插画生成
快速生成各种风格的插画作品
支持多种比例的专业级插画
商业应用
广告素材生成
为营销活动快速生成高质量视觉素材
可直接用于商业用途的高清图像