pipeline_tag: 图像转视频
license: 其他
license_name: stable-video-diffusion-1-1-nc-community
license_link: LICENSE
extra_gated_prompt: |
STABILITY AI 非商业研究社区许可协议
日期:2024年2月2日
点击下方“我接受”或使用/分发模型、软件、软件产品或衍生作品的任何部分,即表示您同意本许可条款。若不同意,则无权通过本许可使用软件产品或衍生作品,并须立即停止使用。若代表雇主或其他实体接受本协议,您向Stability AI声明并保证拥有完整法律授权使其受本协议约束。若无相应授权,不得代表雇主或实体接受许可或访问相关产品。
“协议”指本《稳定非商业研究社区许可协议》。
“AUP”指Stability AI可接受使用政策(https://stability.ai/use-policy),可能不时更新。
“衍生作品”指:(a) 美国版权法认定的软件产品衍生作品;(b) 对模型的修改及基于模型或其输出创建的其他模型(不含模型输出本身)。
“文档”指Stability AI提供的与软件相关的规范、手册等书面信息。
“被许可方”指符合法定年龄且具法律约束力的个人或实体代表。
“模型”指Stability AI根据本协议提供的专有模型与算法(含机器学习模型、训练权重等)。
“非商业用途”指仅用于研究或非商业目的,不包括软件产品或衍生作品的生产性使用。
“Stability AI”指Stability AI有限公司及其关联公司。
“软件”指本协议下的Stability AI专有软件。
“软件产品”指模型、软件及文档的任意组合。
-
许可权利与再分发
a. 遵守本协议、AUP及文档前提下,Stability AI授予您全球性、不可转让、不可分许可、可撤销、免版税的有限许可,仅限非商业用途使用、复制、分发及创建软件产品的衍生作品。
b. 禁止通过托管服务或API使第三方使用软件产品或衍生作品。仅在线分发下载(如在HuggingFace发布模型)不违反本条。商业用途需联系Stability AI(https://stability.ai/contact)。
c. 向第三方分发时须保留本协议及版权声明:“本Stability AI模型依据《非商业研究社区许可协议》授权,版权归Stability AI Ltd所有。”衍生作品须在声明文件中注明修改内容。
-
免责声明
除非法律要求,软件产品及其输出均按“原样”提供,不附带任何明示或暗示担保(包括适销性、特定用途适用性等)。使用风险由您自行承担。
-
责任限制
Stability AI及其关联方不对因本协议产生的任何间接、特殊、附带或惩罚性损害承担责任。
-
知识产权
a. 本协议未授予商标使用权。描述性使用双方标识时须合理且符合惯例。
b. 您拥有自创衍生作品的所有权。
c. 若对Stability AI发起知识产权诉讼,本协议授予的许可将自动终止。您须就违反协议的分发行为赔偿Stability AI。
-
期限与终止
协议自接受时生效,违约时可被终止。终止后须删除所有软件产品及衍生作品。第2-4条在终止后仍有效。
-
适用法律
本协议受美国及加利福尼亚州法律管辖,不考虑冲突法原则。
extra_gated_description: Stable Video Diffusion 1.1许可协议
extra_gated_button_content: 提交
extra_gated_fields:
姓名: 文本
公司名称(如适用): 文本
电子邮箱: 文本
其他意见: 文本
点击即表示接受许可协议,并仅将软件产品及衍生作品用于非商业或研究用途: 复选框
点击即同意Stability AI使用本表单信息进行产品营销联系: 复选框
Stable Video Diffusion 1.1 图像转视频模型卡

Stable Video Diffusion (SVD) 1.1 图像转视频是一款扩散模型,可将静态图像作为条件帧生成视频。
模型详情
模型描述
SVD 1.1 图像转视频是基于潜在扩散训练的模型,能够从条件图像生成短视频片段。
该模型在1024×576分辨率下生成25帧视频,基于SVD图像转视频[25帧]微调。
微调时固定6FPS和Motion Bucket Id 127参数以提升输出一致性,无需调整超参数。这些条件仍可调整,但非固定设置下的性能可能逊于SVD 1.0。
- 开发方: Stability AI
- 资助方: Stability AI
- 模型类型: 生成式图像转视频模型
- 微调基础模型: SVD图像转视频[25帧]
模型来源
推荐研究使用我们的generative-models
GitHub仓库(https://github.com/Stability-AI/generative-models),该库实现了主流扩散框架(训练与推理)。
- 代码库: https://github.com/Stability-AI/generative-models
- 论文: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
用途
直接用途
本模型仅限研究用途,包括:
- 生成模型研究
- 潜在有害内容生成模型的安全部署
- 探究生成模型的局限性与偏差
- 艺术创作与设计应用
- 教育/创意工具开发
超范围用途
该模型未训练用于生成真实人物/事件内容,此类用途超出模型能力范围。禁止违反Stability AI可接受使用政策的行为。
局限性与偏差
局限性
- 生成视频较短(≤4秒),未达到完美真实感
- 可能生成无动态或缓慢平移的视频
- 无法通过文本控制
- 无法生成清晰文字
- 人脸/人物生成可能不准确
- 自编码部分存在信息损失
建议
本模型仅推荐用于研究目的。
快速开始
参考:https://github.com/Stability-AI/generative-models