首个基于DiT架构的实时高质量视频生成模型,支持1216×704分辨率30FPS生成
下载量 208
发布时间 : 5/14/2025
模型简介
基于扩散模型的文本/图像转视频生成系统,通过大规模数据集训练实现高清视频实时生成
模型特点
实时高清生成
能以1216×704分辨率、30帧/秒的速度生成视频,速度快于播放速度
双模态输入
同时支持文本提示和图像输入两种生成模式
高质量输出
通过大规模多样化视频数据集训练,生成内容真实丰富的高清视频
模型能力
文本转视频生成
图像转视频生成
高分辨率视频合成
实时视频渲染
使用案例
创意内容生产
短视频创作
根据文字描述自动生成创意短视频内容
生成720P-1080P高清视频
图像动画化
将静态图片转化为动态视频
保持原始构图的同时添加合理动态效果
营销素材制作
广告视频生成
快速生成产品展示视频
支持多角度展示和场景切换
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文