L

Latte 1

由 maxin-cn 开发
Latte是一个基于Transformer的潜在扩散模型,专注于文本生成视频任务,支持多种数据集预训练权重。
下载量 1,027
发布时间 : 6/3/2024
模型介绍
内容详情
替代品

模型简介

Latte是一个基于Transformer架构的潜在扩散模型,主要用于文本生成视频任务。它支持从文本输入生成高质量视频内容,并提供了多种数据集的预训练权重。

模型特点

文本生成视频
支持从文本描述生成高质量视频内容
多数据集支持
提供FaceForensics、SkyTimelapse、UCF101和Taichi-HD等多种数据集的预训练权重
Transformer架构
采用基于Transformer的潜在扩散模型架构
文本生成图像功能
最新版本Latte-1同时支持文本生成图像功能

模型能力

文本生成视频
文本生成图像

使用案例

视频创作
创意视频生成
根据文本描述自动生成创意视频内容
可生成高质量的视频片段
教育
教学视频生成
根据教学内容自动生成演示视频