T

Text To Video Ms 1.7b

由 vdo 开发
基于多阶段文本生成视频扩散模型架构,输入英文描述文本可生成符合描述的视频内容
下载量 55
发布时间 : 5/7/2023
模型介绍
内容详情
替代品

模型简介

文本生成视频扩散模型包含文本特征提取、扩散模型和视频生成三个子网络,总参数量约17亿,支持从文本描述生成动态视频内容

模型特点

多阶段生成架构
包含文本特征提取、扩散模型和视频生成三个子网络,实现高质量视频生成
长视频生成能力
通过优化技术可在16GB显存下生成最长25秒的视频
开放域生成
支持任意英文文本描述的视频生成,应用场景广泛

模型能力

文本到视频生成
开放域内容创作
动态场景合成

使用案例

创意内容生成
概念可视化
将抽象文本描述转化为可视化视频内容
生成符合文本描述的动态场景
教育演示
生成教学概念的可视化演示视频
帮助理解复杂概念
娱乐内容创作
短视频生成
根据创意文本生成短视频内容
示例中展示了宇航员骑马、达斯·维达冲浪等创意场景