开源Text2Video-Zero文本生成视频工具 - 免费实现GTA-5风格边缘引导视频生成

首页

Text2video Zero Controlnet Canny Gta5

由 PAIR 开发

Text2Video-Zero是一款零样本文本生成视频工具，支持通过ControlNet实现边缘引导的GTA-5风格视频生成。

文本生成视频开源协议:Openrail #零样本视频生成 #GTA-5风格化 #边缘引导控制

下载量 38

发布时间 : 3/24/2023

模型简介

该模型结合DreamBooth和ControlNet技术，能够根据文本提示和边缘条件生成GTA-5风格的视频或图像，支持零样本视频生成和编辑。

模型特点

零样本视频生成

无需额外训练即可根据文本生成视频内容

边缘条件控制

通过ControlNet实现Canny边缘引导的视频/图像生成

GTA-5艺术风格

生成的视频/图像具有GTA-5游戏的艺术风格特征

多条件支持

支持文本、姿态、边缘等多种条件组合控制生成

模型能力

文本生成视频

文本生成图像

视频编辑

风格化生成

边缘引导生成

使用案例

创意内容生成

GTA-5风格视频创作

根据文本描述生成GTA-5艺术风格的短视频内容

生成符合游戏艺术风格的动态场景

边缘引导图像生成

使用Canny边缘图控制生成特定构图的GTA-5风格图像

保持边缘结构的同时应用风格化效果

视频编辑

风格化视频转换

将普通视频转换为GTA-5艺术风格

保持原始视频动态的同时应用风格转换

🚀 Text2Video-Zero模型卡片 - ControlNet Canny GTA-5风格

Text2Video-Zero 是一个零样本的文本到视频生成器。它可以执行 零样本的文本到视频生成、视频指令图像到图像转换（指令引导的视频编辑）、文本和姿态条件视频生成、文本和Canny边缘条件视频生成 以及 文本、Canny边缘和Dreambooth条件视频生成。有关这项工作的更多信息，请查看我们的论文和演示：。我们的代码可与任何StableDiffusion基础模型配合使用。

本模型为 GTA-5风格 提供了 DreamBooth 权重，可在Text2Video-Zero中与边缘引导（使用 ControlNet）一起使用。

✨ 主要特性

支持多种文本到视频及视频编辑任务，包括零样本生成、指令引导编辑等。
代码可与任何StableDiffusion基础模型兼容。
为GTA - 5风格提供DreamBooth权重，可结合边缘引导使用。

📚 详细文档

Text2Video-Zero的权重

我们将原始权重转换为Diffusers格式，并使其可用于带有边缘引导的 ControlNet，使用方法参考：https://github.com/lllyasviel/ControlNet/discussions/12。

模型详情

属性	详情
开发者	Levon Khachatryan、Andranik Movsisyan、Vahram Tadevosyan、Roberto Henschel、Zhangyang Wang、Shant Navasardyan和Humphrey Shi
模型类型	用于Text2Video-Zero的带有边缘控制的Dreambooth文本到图像和文本到视频生成模型
语言	英语
许可证	CreativeML OpenRAIL M许可证
模型描述	这是一个用于 Text2Video-Zero 的带有边缘引导和GTA - 5风格的模型，也可在带有边缘引导的文本到图像设置中与ControlNet一起使用。
DreamBoth关键词	gtav style
更多信息资源	GitHub、论文、CIVITAI
引用格式	@article{text2video-zero, title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators}, author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey}, journal={arXiv preprint arXiv:2303.13439}, year={2023} }

原始权重

GTA - 5风格的Dreambooth权重取自 CIVITAI。

模型详情

属性	详情
开发者	Quiet_Joker（CIVITAI上列出的用户名）
模型类型	Dreambooth文本到图像生成模型
语言	英语
许可证	CreativeML OpenRAIL M许可证
模型描述	这是一个使用 DreamBooth 创建的模型，用于根据文本提示生成GTA - 5风格的图像。
DreamBoth关键词	gtav style
更多信息资源	CIVITAI

📄 许可证

本模型使用 CreativeML OpenRAIL M许可证。

⚠️ 重要提示

⚠️ 重要提示

请注意，Text2Video-Zero可能会输出强化或加剧社会偏见的内容，以及逼真的人脸、色情和暴力内容。本演示中的Text2Video-Zero仅用于研究目的。

📖 引用

如果您使用了本模型，请按照以下格式引用：

@article{text2video-zero,
  title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
  author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
  journal={arXiv preprint arXiv:2303.13439},
  year={2023}
}