D

Dfot

由 kiwhansong 开发
一种新颖的视频扩散模型,能够根据任意数量的上下文帧生成高质量视频
下载量 47.19k
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

DFoT是一种创新的视频生成模型,结合了历史引导(HG)方法,显著提升了视频生成质量、时间一致性和运动动态,支持从单帧或多帧图像生成短视频或极长视频

模型特点

历史引导(HG)方法
DFoT特有的引导技术,显著提升视频生成质量、时间一致性和运动动态
灵活上下文输入
支持从任意数量(包括单张)的上下文帧生成视频
长视频生成能力
能够生成10秒以上的长视频,甚至支持无限导航视频生成
组合视频生成
支持将不同视频片段组合生成连贯的长视频

模型能力

从单张图像生成视频
从多帧图像生成视频
生成长时间稳定视频
组合视频生成
视频动态控制

使用案例

视频创作
短视频生成
从1-2张图像生成2秒的短视频
高质量、时间一致的短视频片段
长视频生成
从单张图像生成10秒以上的长视频
动态稳定、连贯的长视频
无限导航视频
从单张图像生成无限延展的导航视频
持续稳定、无边界限制的视频流
内容编辑
视频组合
将不同视频片段组合生成连贯的新视频
无缝衔接的组合视频