W

Wan2.1 VACE 14B

由 Wan-AI 开发
Wan2.1是一套全面且开放的视频基础模型,旨在突破视频生成的边界,支持多种视频生成和编辑任务。
下载量 8,797
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

Wan2.1是一套先进的视频生成模型,具备文本到视频、图像到视频、视频编辑、文本到图像及视频到音频等多任务支持,推动视频生成领域发展。

模型特点

SOTA性能
在多项基准测试中持续超越现有开源模型及最先进的商业解决方案。
支持消费级GPU
T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级GPU。
多任务支持
在文本到视频、图像到视频、视频编辑、文本到图像及视频到音频任务中表现卓越。
视觉文本生成
首个能生成中英双语文本的视频模型,具备强大的文本生成能力。
高效视频VAE
Wan-VAE在编码和解码任意长度的1080P视频时保持时序信息。

模型能力

文本到视频生成
图像到视频生成
视频编辑
文本到图像生成
视频到音频生成
中英双语文本生成

使用案例

视频创作
短视频生成
根据文本描述生成短视频内容。
生成5秒480P视频约需4分钟(RTX 4090)。
视频编辑
视频风格转换
根据参考图像或文本修改视频风格。