A

Aimv2 3B Patch14 448

由 apple 开发
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多个视觉理解基准测试中表现优异。
下载量 161
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2系列视觉模型通过多模态自回归目标进行预训练,具有强大的图像特征提取和分类能力,在多个基准测试中优于同类模型。

模型特点

多模态自回归预训练
采用多模态自回归目标进行预训练,有效提升模型性能。
卓越的分类性能
在多个基准测试中优于OpenAI CLIP、SigLIP和DINOv2等模型。
大规模参数
3B参数的模型规模,具备强大的特征提取能力。

模型能力

图像特征提取
图像分类
多模态理解

使用案例

计算机视觉
图像分类
在ImageNet等数据集上进行高精度图像分类。
ImageNet-1k准确率89.5%
细粒度分类
在stanford-cars等细粒度分类任务中表现优异。
stanford-cars准确率96.7%
医学影像
病理图像分析
在camelyon17等医学影像数据集上进行分类。
camelyon17准确率93.4%