W

Wan2.1 T2V 1.3B

由 Isi99999 开发
万2.1是一套全面开放的视频基础模型,旨在突破视频生成的边界,支持中英双语文本生成视频、图像生成视频等多种任务。
下载量 40
发布时间 : 2/27/2025
模型介绍
内容详情
替代品

模型简介

万2.1是一个先进的视频生成模型,支持文本生成视频、图像生成视频、视频编辑、文本生成图像及视频生成音频等多种任务,具有顶尖性能和高效的计算效率。

模型特点

顶尖性能
在多项基准测试中均超越现有开源模型及商业解决方案。
支持消费级GPU
T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级显卡。
多任务支持
涵盖文本生成视频、图像生成视频、视频编辑、文本生成图像及视频生成音频。
视觉文本生成
首个支持中英双语文本生成的视频模型,文本生成能力强大。
高效视频VAE
万-VAE在编码解码任意长度1080P视频时保持时序信息,为视频与图像生成提供理想基础。

模型能力

文本生成视频
图像生成视频
视频编辑
文本生成图像
视频生成音频

使用案例

创意视频制作
拟人化动物视频
生成拟人化动物行为的视频,如猫咪拳击比赛。
生成5秒480P视频约需4分钟(RTX 4090)。
教育内容
教学视频生成
根据文本描述生成教学视频内容。