C

Consisid Preview

由 BestWishYsh 开发
通过频率分解实现身份保持的文本到视频生成模型,能够在生成视频时保持人物身份的一致性。
下载量 322
发布时间 : 11/26/2024
模型介绍
内容详情
替代品

模型简介

ConsisID是一个基于THUDM/CogVideoX-5b和THUDM/CogVideoX1.5-5B-I2V微调的文本到视频生成模型,专注于在视频生成过程中保持人物身份的连续性。该模型通过频率分解技术优化了面部特征的保持能力,适用于需要高保真人物身份的视频生成场景。

模型特点

身份保持
通过先进的频率分解技术,在视频生成过程中保持人物面部特征的连续性
高质量视频生成
能够生成720x480分辨率、8FPS的6秒视频
提示优化支持
对长且描述详细的提示有良好响应,提供提示优化建议

模型能力

文本到视频生成
面部特征保持
动态场景生成

使用案例

影视制作
角色场景生成
为特定角色生成连贯的视频场景
保持角色面部特征一致的视频序列
广告创意
品牌代言人生成
生成品牌代言人在不同场景下的连贯视频
身份一致的品牌宣传视频