开源协议: MIT
标签:
- 图像生成
- HiDream.ai
支持语言:
- 英语
任务类型: 文生图
库名称: diffusers

HiDream-I1
是一款拥有170亿参数的全新开源图像生成基础模型,可在数秒内实现业界领先的图像生成质量。
欲体验完整功能,请访问 https://vivago.ai/
项目动态
核心优势
- ✨ 卓越画质 - 支持照片级写实、卡通、艺术等多种风格,HPS v2.1评分达到人类偏好级水准
- 🎯 精准提示跟随 - 在GenEval和DPG基准测试中全面领先所有开源模型
- 🔓 完全开源 - 采用MIT协议,推动科研进步与创意创新
- 💼 商业友好 - 生成图像可自由用于个人项目、科研及商业场景
快速开始
请确保已安装Flash Attention,推荐手动安装CUDA 12.4版本
pip install -r requirements.txt
克隆代码库:
git clone https://github.com/HiDream-ai/HiDream-I1
运行推理脚本生成图像:
python ./inference.py --model_type full
python ./inference.py --model_type dev
python ./inference.py --model_type fast
注意: 推理脚本将自动下载meta-llama/Meta-Llama-3.1-8B-Instruct
模型文件。若遇网络问题,可提前下载并放置于缓存目录避免中断。
Gradio演示
我们还提供交互式图像生成界面:
python gradio_demo.py
评估指标
DPG基准
模型 |
综合得分 |
全局理解 |
实体还原 |
属性呈现 |
关系表达 |
其他要素 |
PixArt-alpha |
71.11 |
74.97 |
79.32 |
78.60 |
82.57 |
76.96 |
SDXL |
74.65 |
83.27 |
82.43 |
80.91 |
86.76 |
80.41 |
DALL-E 3 |
83.50 |
90.97 |
89.61 |
88.39 |
90.58 |
89.83 |
Flux.1-dev |
83.79 |
85.80 |
86.79 |
89.98 |
90.04 |
89.90 |
SD3-Medium |
84.08 |
87.90 |
91.01 |
88.83 |
80.70 |
88.68 |
Janus-Pro-7B |
84.19 |
86.90 |
88.90 |
89.40 |
89.32 |
89.48 |
CogView4-6B |
85.13 |
83.85 |
90.35 |
91.17 |
91.14 |
87.29 |
HiDream-I1 |
85.89 |
76.44 |
90.22 |
89.48 |
93.74 |
91.83 |
GenEval
模型 |
综合得分 |
单对象 |
双对象 |
计数能力 |
色彩还原 |
位置理解 |
色彩归因 |
SDXL |
0.55 |
0.98 |
0.74 |
0.39 |
0.85 |
0.15 |
0.23 |
PixArt-alpha |
0.48 |
0.98 |
0.50 |
0.44 |
0.80 |
0.08 |
0.07 |
Flux.1-dev |
0.66 |
0.98 |
0.79 |
0.73 |
0.77 |
0.22 |
0.45 |
DALL-E 3 |
0.67 |
0.96 |
0.87 |
0.47 |
0.83 |
0.43 |
0.45 |
CogView4-6B |
0.73 |
0.99 |
0.86 |
0.66 |
0.79 |
0.48 |
0.58 |
SD3-Medium |
0.74 |
0.99 |
0.94 |
0.72 |
0.89 |
0.33 |
0.60 |
Janus-Pro-7B |
0.80 |
0.99 |
0.89 |
0.59 |
0.90 |
0.79 |
0.66 |
HiDream-I1 |
0.83 |
1.00 |
0.98 |
0.79 |
0.91 |
0.60 |
0.72 |
HPSv2.1评分
模型 |
平均分 |
动画风格 |
概念艺术 |
绘画作品 |
摄影作品 |
Stable Diffusion v2.0 |
26.38 |
27.09 |
26.02 |
25.68 |
26.73 |
Midjourney V6 |
30.29 |
32.02 |
30.29 |
29.74 |
29.10 |
SDXL |
30.64 |
32.84 |
31.36 |
30.86 |
27.48 |
Dall-E3 |
31.44 |
32.39 |
31.09 |
31.18 |
31.09 |
SD3 |
31.53 |
32.60 |
31.82 |
32.06 |
29.62 |
Midjourney V5 |
32.33 |
34.05 |
32.47 |
32.24 |
30.56 |
CogView4-6B |
32.31 |
33.23 |
32.60 |
32.89 |
30.52 |
Flux.1-dev |
32.47 |
33.87 |
32.27 |
32.62 |
31.11 |
stable cascade |
32.95 |
34.58 |
33.13 |
33.29 |
30.78 |
HiDream-I1 |
33.82 |
35.05 |
33.74 |
33.88 |
32.61 |
许可协议
本仓库Transformer模型采用MIT协议。VAE组件来自FLUX.1 [schnell]
,文本编码器分别采用google/t5-v1_1-xxl
(Apache 2.0协议)和meta-llama/Meta-Llama-3.1-8B-Instruct
(Llama 3.1社区许可协议)。您拥有生成内容的所有权,但须遵守组件对应的许可条款。禁止生成违法内容、有害信息、侵犯他人隐私的素材、虚假信息或针对弱势群体的不当内容。
致谢
- VAE组件源自
FLUX.1 [schnell]
(Apache 2.0协议)
- 文本编码器采用
google/t5-v1_1-xxl
(Apache 2.0协议)与meta-llama/Meta-Llama-3.1-8B-Instruct
(Llama 3.1社区许可协议)