A

Aimv2 Large Patch14 224

由 apple 开发
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多项视觉任务中表现优异。
下载量 759
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2采用多模态自回归预训练方法,具有强大的图像特征提取能力,适用于多种视觉分类任务。

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提升模型性能
卓越的分类性能
在多个基准数据集上达到最先进的分类准确率
强大的扩展能力
预训练方法简单直接,能有效扩展训练规模

模型能力

图像特征提取
图像分类
多模态理解

使用案例

计算机视觉
通用图像分类
在ImageNet等通用图像数据集上进行分类
ImageNet-1k准确率86.6%
细粒度分类
在stanford-cars等细粒度分类任务上的应用
stanford-cars准确率96.3%
医学图像分析
在camelyon17等医学图像数据集上的应用
camelyon17准确率93.7%