4

4M 21 B

由 EPFL-VILAB 开发
4M是一个通过标记化与掩码技术实现多模态扩展的'任意到任意'基础模型训练框架
下载量 324
发布时间 : 6/12/2024
模型介绍
内容详情
替代品

模型简介

4M框架训练的多模态基础模型能执行广泛视觉任务,可迁移至未见过的任务与模态,并具备灵活可控的多模态生成能力。

模型特点

任意到任意多模态转换
支持数十种模态间的相互转换与处理
任务迁移能力
可迁移至未见过的任务与模态
可控生成
具备灵活可控的多模态生成能力
开源框架
提供完整的训练框架和预训练模型

模型能力

多模态数据处理
视觉任务处理
跨模态转换
可控内容生成

使用案例

计算机视觉
图像理解与生成
处理各种视觉理解任务并生成相关内容
多模态应用
跨模态转换
在不同模态数据间进行转换处理