stable-video-diffusion-img2vid-xt开源模型 - 用图片免费生成576x1024分辨率25帧短视频

首页

Stable Video Diffusion Img2vid Xt

由 thingthatis 开发

基于静态图像生成短视频片段的扩散模型，支持576x1024分辨率25帧视频生成

视频处理开源协议:其他 #静态图转视频 #高帧率生成 #艺术创作辅助

下载量 17

发布时间 : 12/8/2023

模型简介

该模型是一种潜在扩散模型，通过输入静态图像作为条件帧，生成短视频片段。基于SVD图像转视频[14帧]微调，提升了时间一致性和分辨率支持。

模型特点

高分辨率支持

支持576x1024分辨率的视频生成

长视频生成

可生成25帧的视频片段（约4秒）

时间一致性优化

微调了f8解码器以提升生成视频的时间一致性

模型能力

从静态图像生成视频

高分辨率视频生成

保持时间一致性

使用案例

艺术创作

概念艺术动画化

将静态概念艺术转化为动态展示

生成4秒左右的动态展示视频

研究

生成模型研究

研究图像到视频的生成技术

内容安全研究

研究可能产生有害内容的模型安全部署

🚀 稳定视频扩散图像转视频模型卡片

稳定视频扩散（SVD）图像转视频模型是一种扩散模型，它以静态图像作为条件帧，进而生成视频，为图像到视频的转换提供了强大的解决方案。

🚀 快速开始

若要开始使用该模型，请查看：https://github.com/Stability-AI/generative-models

✨ 主要特性

以静态图像为条件帧生成视频。
经过微调，能生成25帧分辨率为576x1024的短视频片段。
对f8 - 解码器进行微调以确保时间一致性。
额外提供标准逐帧解码器。

📚 详细文档

模型详情

模型描述

稳定视频扩散（SVD）图像转视频是一种潜在扩散模型，经过训练可根据图像条件生成短视频片段。该模型经过训练，在给定相同大小的上下文帧的情况下，能生成25帧分辨率为576x1024的视频，它是在SVD图像转视频 [14帧]的基础上进行微调的。同时，为了保证时间一致性，我们还对广泛使用的f8 - 解码器进行了微调。为方便使用，我们还在此处提供了带有标准逐帧解码器的模型：标准逐帧解码器。

属性	详情
开发者	Stability AI
资助方	Stability AI
模型类型	生成式图像转视频模型
微调基础模型	SVD图像转视频 [14帧]

模型来源

出于研究目的，我们推荐使用我们的 generative - models GitHub仓库（https://github.com/Stability-AI/generative-models），该仓库实现了最流行的扩散框架（包括训练和推理）。

仓库地址：https://github.com/Stability-AI/generative-models
论文地址：https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets