C

Coreml Stable Diffusion 2 1 Base

由 pcuenq 开发
基于潜在扩散模型的文本生成图像系统,支持高分辨率图像合成与编辑
下载量 164
发布时间 : 12/23/2022
模型介绍
内容详情
替代品

模型简介

该模型可根据文本提示生成和修改图像,使用OpenCLIP-ViT/H作为文本编码器,在LAION-5B数据集子集上训练

模型特点

苹果硬件优化
提供Core ML格式权重,专为苹果硅芯片优化,支持Swift/Python推理
安全过滤
训练数据经过NSFW过滤器处理(p_unsafe=0.1阈值),并采用两阶段微调策略
高分辨率生成
支持768x768分辨率图像生成,基于v-目标函数优化

模型能力

文本生成图像
图像编辑
艺术创作
风格迁移

使用案例

艺术创作
概念设计
根据文字描述生成艺术概念图
快速可视化创意构思
数字艺术
生成各种风格的数字艺术作品
支持多种艺术风格输出
教育研究
生成模型研究
探究扩散模型的局限性与偏见
可用于学术论文实验