许可证:Apache-2.0
支持语言:
功能标签:文本生成视频
库名称:diffusers
标签:
万趣
😊 欢迎使用!


English | 简体中文
目录
模型地址
V1.0版本:
名称 |
存储大小 |
Hugging Face |
Model Scope |
描述 |
Wan2.1-Fun-1.3B-InP |
19.0 GB |
🤗链接 |
😄链接 |
Wan2.1-Fun-1.3B文生视频模型,支持多分辨率训练及首尾帧预测。 |
Wan2.1-Fun-14B-InP |
47.0 GB |
🤗链接 |
😄链接 |
Wan2.1-Fun-14B文生视频模型,支持多分辨率训练及首尾帧预测。 |
Wan2.1-Fun-1.3B-Control |
19.0 GB |
🤗链接 |
😄链接 |
支持Canny、Depth、Pose、MLSD等多种控制条件的1.3B视频控制模型,兼容轨迹控制,可生成512/768/1024分辨率视频,训练帧率16fps/81帧,支持多语言。 |
Wan2.1-Fun-14B-Control |
47.0 GB |
🤗链接 |
😄链接 |
支持多种控制条件的14B视频控制模型,功能同1.3B版本,具备更高生成质量。 |
视频展示
Wan2.1-Fun-14B-InP 与 1.3B-InP 生成效果
(此处保留原视频表格结构,内容翻译略)
Wan2.1-Fun-14B-Control 与 1.3B-Control 控制效果
(此处保留原视频表格结构,内容翻译略)
快速开始
1. 云端部署:阿里云DSW/Docker
a. 阿里云DSW
免费领取GPU时长:活动链接

b. ComfyUI集成
界面示意图:

c. Docker部署
docker pull mybigpai-public-registry.cn-beijing.cr.aliyuncs.com/easycv/torch_cuda:cogvideox_fun
docker run -it -p 7860:7860 --network host --gpus all --security-opt seccomp:unconfined --shm-size 200g mybigpai-public-registry.cn-beijing.cr.aliyuncs.com/easycv/torch_cuda:cogvideox_fun
git clone https://github.com/aigc-apps/CogVideoX-Fun.git
cd CogVideoX-Fun
mkdir -p models/Diffusion_Transformer models/Personalized_Model
2. 本地安装
a. 环境要求
已验证平台:
- Windows:Win10 + Python 3.10/3.11 + CUDA 11.8/12.1 + 显卡3060(12G)/3090(24G)
- Linux:Ubuntu 20.04/CentOS + Python 3.10/3.11 + CUDA 11.8/12.1 + 显卡V100(16G)/A10(24G)/A100(40G/80G)
需预留60GB磁盘空间。
b. 权重放置
推荐目录结构:
models/
├── Diffusion_Transformer/ # 存放主模型
│ ├── CogVideoX-Fun-V1.1-5b-InP/
│ └── Wan2.1-Fun-14B-InP/
└── Personalized_Model/ # 存放个性化训练模型/LoRA
使用方法
1. 生成视频
a. 显存优化方案
提供三种模式:
model_cpu_offload
:基础显存节省
model_cpu_offload_and_qfloat8
:量化+显存节省(质量略有下降)
sequential_cpu_offload
:最大显存节省(速度较慢)
b. 通过ComfyUI
详见ComfyUI说明文档。
c. Python脚本调用
- 文生视频:修改
predict_t2v.py
中的提示词参数后运行
- 图生视频:指定首尾帧图片路径后运行
predict_i2v.py
- 视频转视频:需提供参考视频(如吉他演示视频)
- 控制生成:使用Canny/Pose等处理后的控制视频(如姿势示例)
d. WebUI界面
运行app.py
启动交互界面,支持所有生成模式。
参考文献
- CogVideo:https://github.com/THUDM/CogVideo/
- EasyAnimate:https://github.com/aigc-apps/EasyAnimate
- Wan2.1:https://github.com/Wan-Video/Wan2.1/
许可协议
本项目采用 Apache License 2.0。