4

4M 21 XL

由 EPFL-VILAB 开发
4M是一个训练'任意到任意'多模态基础模型的框架,通过标记化和掩码技术扩展到多种不同模态。
下载量 57
发布时间 : 6/12/2024
模型介绍
内容详情
替代品

模型简介

4M框架训练的基础模型能够执行广泛的视觉任务,具有良好的迁移能力,并且是灵活可控的多模态生成模型。

模型特点

任意到任意多模态转换
支持数十种不同模态之间的任意转换
强大的迁移能力
能够很好地迁移到未见过的任务和模态
灵活可控的生成
作为多模态生成模型具有高度灵活性和可控性

模型能力

多模态掩码建模
视觉任务处理
多模态生成
跨模态转换

使用案例

计算机视觉
图像生成
从其他模态(如文本、深度图等)生成图像
多模态处理
跨模态转换
在不同视觉和语言模态之间进行转换