W

Wan2.1 VACE 1.3B

由 Wan-AI 开发
Wan2.1是一套开放且先进的视频生成基础模型,支持多种视频生成和编辑任务。
下载量 1,520
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

Wan2.1是一套全面的视频基础模型,旨在突破视频生成的边界,支持文本到视频、图像到视频、视频编辑、文本到图像及视频到音频等多种任务。

模型特点

顶尖性能
在多项基准测试中持续超越现有开源模型及商业解决方案。
支持消费级GPU
T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级GPU。
多任务支持
擅长文本到视频、图像到视频、视频编辑、文本到图像及视频到音频任务。
视觉文本生成
首个支持中英双语文本生成的视频模型,具备强大的文本生成能力。
高效视频VAE
Wan-VAE在编码解码任意长度的1080P视频时保持时序信息。

模型能力

文本到视频生成
图像到视频生成
视频编辑
文本到图像生成
视频到音频生成
中英双语文本生成

使用案例

视频创作
短视频生成
根据文本描述生成短视频内容。
生成5秒480P视频约需4分钟(RTX 4090)
视频编辑
视频风格转换
基于参考视频编辑现有视频风格。