T

Text2motion

由 Quantamhash 开发
开放且先进的大规模视频生成模型套件,支持文本生成视频、图像生成视频等多种任务
下载量 233
发布时间 : 3/21/2025
模型介绍
内容详情
替代品

模型简介

文本转动态是一套全面开放的视频基础模型套件,突破视频生成边界,支持中英双语文本生成,兼容480P/720P双分辨率

模型特点

顶尖性能
在多项基准测试中超越现有开源模型和商业解决方案
消费级显卡支持
T2V-1.3B模型仅需8.19GB显存,RTX 4090上生成5秒480P视频约4分钟
多任务支持
支持文本生成视频、图像生成视频、视频编辑等多种任务
双语文本生成
首个支持中英双语文本生成的视频模型
高效视频VAE
编解码任意长度1080P视频时保持时序信息,效率与性能俱佳

模型能力

文本生成视频
图像生成视频
视频编辑
文本生成图像
视频生成音频

使用案例

娱乐内容创作
动画短片生成
根据文本描述生成拟人化动物动画
示例:生成两只拟人化猫咪拳击比赛的480P/720P视频
广告制作
产品展示视频
根据产品描述自动生成展示视频