4

4M 21 L

由 EPFL-VILAB 开发
4M是一个通过标记化与掩码技术扩展至多种模态的'任意到任意'基础模型训练框架
下载量 49
发布时间 : 6/12/2024
模型介绍
内容详情
替代品

模型简介

基于4M训练的模型能执行广泛视觉任务,可迁移至未见过的任务与模态,并具备灵活可控的多模态生成能力

模型特点

任意到任意多模态处理
支持数十种模态和任务的灵活处理能力
可扩展性
框架设计支持扩展到新的模态和任务
迁移学习能力
可迁移至未见过的任务与模态
可控多模态生成
具备灵活可控的多模态生成能力

模型能力

多模态掩码建模
视觉任务处理
跨模态迁移学习
可控内容生成

使用案例

计算机视觉
多模态视觉理解
处理和理解多种视觉模态数据
生成式AI
可控内容生成
根据输入条件生成多模态内容