A

Aimv2 Huge Patch14 336

由 apple 开发
AIMv2 是通过多模态自回归目标预训练的视觉模型系列,在多个视觉理解基准测试中表现优异。
下载量 188
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2 是一种高效的视觉模型,采用多模态自回归目标预训练方法,适用于图像分类和特征提取任务。

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提升模型性能。
卓越的基准测试表现
在多个视觉理解基准测试中优于 CLIP 和 SigLIP 等模型。
强大的识别性能
在 ImageNet 等数据集上达到高准确率。

模型能力

图像分类
图像特征提取
多模态理解

使用案例

计算机视觉
图像分类
对图像进行分类,支持多种数据集。
在 ImageNet-1k 上达到 88.2% 准确率
细粒度分类
对特定领域的图像进行细粒度分类。
在 Stanford Cars 上达到 96.4% 准确率
医疗影像
病理图像分析
用于医疗影像的分类和分析。
在 Camelyon17 上达到 93.3% 准确率