S

Stable Diffusion 3.5 Large

由 stabilityai 开发
基于多模态扩散Transformer架构的文本生成图像模型,在图像质量、排版效果和复杂提示理解方面有显著提升
下载量 143.20k
发布时间 : 10/22/2024
模型介绍
内容详情
替代品

模型简介

可根据文本提示生成高质量图像,适用于创意设计、教育工具开发等场景

模型特点

多模态扩散Transformer架构
采用MMDiT架构,集成三个固定预训练文本编码器,提升图像生成质量
QK归一化技术
增强训练稳定性,提高模型性能
多文本编码器支持
支持CLIP系列和T5文本编码器,增强文本理解能力
资源效率优化
提供量化部署方案,降低显存占用

模型能力

文本生成图像
复杂提示理解
高质量图像生成
排版效果优化

使用案例

创意设计
艺术创作
根据文本描述生成艺术作品
高质量的艺术图像
设计辅助
为设计师提供创意灵感
多样化的设计概念
教育工具
教育内容生成
为教育工具生成图像内容
丰富的教育素材
研究
生成模型研究
用于文本到图像生成模型的研究
先进的模型架构和技术