W

Wan2.1 I2V 14B 720P

由 wan-community 开发
万2.1是一套全面开放的视频基础模型,具有顶尖性能、支持消费级GPU、多任务支持、视觉文本生成和高效视频VAE等特点。
下载量 37
发布时间 : 4/17/2025
模型介绍
内容详情
替代品

模型简介

万2.1是一套开放且先进的大规模视频生成模型,支持文本转视频、图像转视频、视频编辑、文本转图像及视频转音频任务,推动视频生成领域发展。

模型特点

顶尖性能
在多项基准测试中持续超越现有开源模型及商业解决方案。
支持消费级GPU
T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级GPU。
多任务支持
在文本转视频、图像转视频、视频编辑、文本转图像及视频转音频任务中表现卓越。
视觉文本生成
首个支持中英文文本生成的视频模型,其强大的文本生成能力显著提升了实际应用价值。
高效视频VAE
万-VAE在效率与性能上表现突出,可编码解码任意长度的1080P视频并保留时序信息。

模型能力

文本转视频
图像转视频
视频编辑
文本转图像
视频转音频
中英文文本生成

使用案例

视频生成
图像转视频
将静态图像转换为动态视频,支持720P高清视频生成。
在闭源与开源方案中均表现最优,达到业界领先水平。
文本转视频
根据文本描述生成动态视频,支持480P与720P分辨率。
在RTX 4090上生成一段5秒480P视频约需4分钟。