N

Nova D48w1024 Osp480

由 BAAI 开发
北京智源研究院开发的非量化自回归文本生成视频模型,能够根据文本提示生成和编辑视频
下载量 314
发布时间 : 12/17/2024
模型介绍
内容详情
替代品

模型简介

基于非量化视频自回归扩散架构(NOVA)开发的模型,采用预训练文本编码器(Phi-2)和视频VAE标记器(OpenSoraPlanV1.2-VAE)构建,能够根据文本提示生成和编辑视频

模型特点

高分辨率视频生成
能够生成768x480像素分辨率的视频
文本条件生成
根据文本提示生成和编辑视频内容
参数可调
可通过调整参数提升生成视频的画质

模型能力

文本到视频生成
视频编辑
单帧图像生成

使用案例

研究与教育
生成模型研究
用于生成模型相关技术研究
教育工具开发
开发教育或创意工具
创意与设计
艺术创作
用于艺术创作与设计应用