A

Aimv2 1B Patch14 336

由 apple 开发
AIMv2 是通过多模态自回归目标预训练的视觉模型系列,在多项多模态理解基准测试中表现优异。
下载量 52
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2 是一种视觉模型,采用多模态自回归目标进行预训练,具有强大的图像特征提取和分类能力。

模型特点

多模态自回归预训练
采用多模态自回归目标进行预训练,提升模型在多模态理解任务中的表现。
高性能
在多项基准测试中表现优于 OAI CLIP 和 SigLIP,展现出强大的识别性能。
广泛适用性
在多种数据集(如 ImageNet、CIFAR、Food101 等)上均表现出色。

模型能力

图像特征提取
图像分类
多模态理解

使用案例

计算机视觉
图像分类
对图像进行分类,适用于多种数据集。
在 ImageNet-1k 上准确率达到 88.7%。
目标检测
在开放词汇目标检测任务中表现优异。
优于 DINOv2 模型。
医疗影像
病理图像分析
用于分析医疗影像数据。
在 Camelyon17 数据集上准确率达到 94.2%。