H

Hunyuanvideo I2V

由 tencent 开发
混元视频-I2V是一个全新的图像转视频生成框架,基于腾讯混元视频模型扩展,支持从静态图像生成高质量视频内容。
下载量 3,272
发布时间 : 3/5/2025

模型简介

混元视频-I2V是一个基于混元视频模型的图像转视频生成框架,通过token替换技术将参考图像信息融入视频生成流程,利用多模态大语言模型增强对输入图像语义内容的理解能力。

模型特点

图像语义理解
采用预训练的多模态大语言模型作为文本编码器,增强对输入图像语义内容的理解能力
跨模态注意力
图像token与视频潜在token拼接后支持跨模态的全注意力计算
高分辨率生成
支持最高720P分辨率,最长129帧(5秒)的视频生成
LoRA特效支持
提供LoRA特效训练代码,可用于创作更有趣的视频效果

模型能力

静态图像转视频
高分辨率视频生成
多模态内容理解
视频特效定制

使用案例

内容创作
短视频生成
从单张图片生成短视频内容
生成5秒720P分辨率视频
特效制作
LoRA特效视频
通过LoRA训练定制视频特效
实现特定风格或效果转换
AIbase
智启未来,您的人工智能解决方案智库
简体中文