license: creativeml-openrail-m
library_name: diffusers
inference: true
pipeline_tag: text-to-video
tags:
- text-to-video
- text-to-image
Text2Video-Zero 模型卡片 - ControlNet 动漫风格边缘控制版
Text2Video-Zero 是一款零样本文本转视频生成器。它能实现以下功能:
- 零样本文本生成视频
- 视频指令式Pix2Pix编辑(通过指令引导视频修改)
- 文本+姿态条件视频生成
- 文本+边缘检测条件视频生成
- 文本+边缘检测+DreamBooth条件视频生成
更多技术细节请参阅我们的论文或体验在线演示:
我们的开源代码兼容所有StableDiffusion基础模型。
本模型提供专为动漫风格优化的DreamBooth权重,可结合边缘引导(通过ControlNet)用于Text2Video-Zero视频生成。
Text2Video-Zero专用权重
我们已将原始权重转换为diffusers格式,并通过ControlNet讨论帖实现边缘引导功能。
模型详情
-
开发团队:Levon Khachatryan, Andranik Movsisyan, Vahram Tadevosyan, Roberto Henschel, Zhangyang Wang, Shant Navasardyan, Humphrey Shi
-
模型类型:支持边缘控制的DreamBooth文本转图像/视频生成模型
-
语言:英语
-
许可协议:CreativeML OpenRAIL M许可证
-
模型描述:专为Text2Video-Zero设计的动漫风格边缘控制模型,也可用于ControlNet文本转图像场景。
-
DreamBooth触发词:anime style
-
扩展资源:GitHub、论文、CIVITAI
-
引用格式:
@article{text2video-zero,
title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
journal={arXiv preprint arXiv:2303.13439},
year={2023}
}
原始权重来源
动漫风格的DreamBooth权重取自CIVITAI。
原始模型详情
- 开发者:CIVITAI用户Quiet_Joker
- 模型类型:DreamBooth文本转图像生成模型
- 语言:英语
- 许可协议:CreativeML OpenRAIL M许可证
- 模型描述:基于文本提示生成动漫风格图像的DreamBooth微调模型
- DreamBooth触发词:anime style
- 资源链接:CIVITAI
偏见内容声明
请注意:Text2Video-Zero可能生成强化社会偏见的内容,包括真实人脸、色情或暴力场景。本演示版本仅供研究用途。
引用文献
@article{text2video-zero,
title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
journal={arXiv preprint arXiv:2303.13439},
year={2023}
}