J

Joyvasa

由 jdh-algo 开发
JoyVASA是一种基于扩散模型的音频驱动面部动画生成方法,能够生成面部动态和头部运动,支持多语言输入。
下载量 95
发布时间 : 11/13/2024
模型介绍
内容详情
替代品

模型简介

JoyVASA通过解耦的面部表征框架和扩散变换器技术,从音频线索生成高质量的面部动画,适用于人物肖像和动物面部。

模型特点

解耦面部表征
将动态面部表情与静态3D面部表征分离,支持更长的视频生成
身份无关运动生成
扩散变换器直接从音频生成运动序列,不受角色身份影响
跨物种支持
不仅能处理人物肖像,还能为动物面部生成动画
多语言支持
在中文私有数据集和英文公开数据集的混合数据上训练

模型能力

音频驱动面部动画生成
3D面部表征渲染
跨物种面部动画
长视频序列生成

使用案例

数字娱乐
虚拟主播动画
为虚拟主播生成与语音同步的面部表情和头部运动
自然流畅的面部动画效果
教育
动物形象教学
为教育内容中的动物形象生成生动的面部动画
增强教学内容的趣味性和互动性