高质量图像生成
CAD I
MIT
通过策略性数据增强方法在小规模精选数据集上训练的文本生成图像模型,显著提升生成质量
文本生成图像
C
Lucasdegeorge
17
3
Noob Sdxl Controlnet Manga Line
其他
基于稳定扩散XL(Stable Diffusion XL)的文本生成图像模型,支持通过控制网络实现精细化图像生成。
图像生成
英语
N
Eugeoter
2,289
4
Vila U 7b 256
MIT
VILA-U是一个统一处理视觉语言理解与生成任务的基础模型,通过单一自回归框架实现高效的多模态处理。
文本生成图像
V
mit-han-lab
127
21
Emu3 Stage1
Apache-2.0
Emu3是由北京智源研究院开发的多模态模型,仅通过预测下一个标记训练而成,支持图像、文本和视频处理。
文本生成图像
Transformers
E
BAAI
1,359
26
Emu3 VisionTokenizer
Apache-2.0
Emu3是仅通过下一词元预测训练的全新多模态模型套件,在生成与感知任务中均超越多个专业模型
文本生成图像
Transformers
E
BAAI
19.82k
58
Kolors
Apache-2.0
可图(Kolors)是快手可图团队自研的大规模文生图潜空间扩散模型,在生成图像视觉质量、复杂语义还原度、中英文字体渲染等方面表现优异。
文本生成图像
支持多种语言
K
Kwai-Kolors
1,546
799
Midjourney Mini
MIT
Midjourney-mini是一款免费的人工智能模型,能够根据文本描述生成逼真图像。
图像生成
支持多种语言
M
openskyml
644
16
Maya
Openrail
基于Stable Diffusion 1.5训练的Openjourney微调模型,使用超过60,000张图像进行训练,优化了图像生成质量。
图像生成
M
Horosheff
30
0
Ddpm Ema Celebahq 256
Apache-2.0
DDPM是一种基于扩散概率模型的高质量图像生成模型,受非平衡热力学启发,通过渐进式去噪过程生成图像。
图像生成
D
google
36.98k
8
Ddpm Celebahq 256
Apache-2.0
基于扩散概率模型的高质量图像生成模型,在无条件图像生成任务中表现优异
图像生成
D
google
21.82k
48
Ddpm Cat 256
Apache-2.0
基于扩散概率模型的高质量图像生成模型,在无条件图像生成任务中表现优异
图像生成
D
google
2,658
11