T

Text To Video Lvd Ms

由 longlian 开发
该模型结合大语言模型与视频扩散技术,支持文本到视频生成,并可通过边界框条件输入控制视频内容。
下载量 91
发布时间 : 4/8/2024
模型介绍
内容详情
替代品

模型简介

基于大语言模型的视频扩散模型(LVD)支持文本到视频生成,采用GLIGEN风格的边界框条件输入,可直接使用魔搭社区的现成模型。

模型特点

边界框条件控制
支持GLIGEN风格的边界框条件输入,可精确控制视频中对象的位置和大小。
大语言模型集成
结合大语言模型增强提示理解能力,提升文本到视频的生成质量。
灵活应用
可作为视频版GLIGEN单独使用,也可与动态场景布局生成器配合使用。

模型能力

文本到视频生成
边界框条件控制
动态场景生成

使用案例

创意内容生成
短视频创作
根据文本描述自动生成短视频内容
可生成符合文本描述的动态视频场景
教育
教学视频生成
根据教学大纲自动生成教学视频