W

Wan2.1 T2V 1.3B Diffusers

由 Wan-AI 开发
万2.1是一套全面开放的视频基础模型,具备顶尖性能、支持消费级GPU、多任务支持、视觉文本生成和高效视频VAE等特点。
下载量 45.29k
发布时间 : 3/1/2025
模型介绍
内容详情
替代品

模型简介

万2.1是一套开放且先进的大规模视频生成模型,旨在突破视频生成的边界。它支持文本生成视频、图像生成视频、视频编辑、文本生成图像及视频生成音频等多种任务。

模型特点

顶尖性能
在多项基准测试中持续超越现有开源模型及商业解决方案。
支持消费级GPU
T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级显卡。
多任务支持
擅长文本生成视频、图像生成视频、视频编辑、文本生成图像及视频生成音频,推动视频生成领域发展。
视觉文本生成
首个支持中英双语文本生成的视频模型,强大的文本生成能力显著提升实用价值。
高效视频VAE
万-VAE在编码解码任意长度1080P视频时保持时序信息,为视频与图像生成提供理想基础。

模型能力

文本生成视频
图像生成视频
视频编辑
文本生成图像
视频生成音频

使用案例

创意视频制作
动画短片生成
使用文本描述生成拟人化角色的动画短片。
生成5秒480P视频约需4分钟(RTX 4090)
视频编辑
视频风格转换
将现有视频转换为不同风格。