C

Cogvideox 5b

由 vdo 开发
CogVideoX是源自清影的视频生成模型开源版本,5B版本具有更大的模型规模,能生成更高质量的视频内容。
下载量 13
发布时间 : 8/28/2024
模型介绍
内容详情
替代品

模型简介

CogVideoX是一个文本生成视频的模型,能够根据文本描述生成6秒时长的720x480分辨率视频,帧率为每秒8帧。

模型特点

高质量视频生成
5B参数规模提供更高质量的视频生成效果
多精度支持
支持BF16、FP16、FP32、FP8、INT8等多种推理精度
优化显存占用
通过diffusers库的优化技术降低显存需求
固定视频规格
生成6秒时长、720x480分辨率、8fps帧率的视频

模型能力

文本到视频生成
创意视频创作
场景可视化

使用案例

创意内容生成
艺术场景生成
根据诗意描述生成艺术性视频场景
如花园、暴雨等场景的生动呈现
故事可视化
将文字故事转化为视频片段
如宇航员与外星人相遇等场景
教育演示
概念可视化
将抽象概念转化为直观视频