A

Aimv2 3B Patch14 336

由 apple 开发
AIMv2 是一个通过多模态自回归目标预训练的视觉模型系列,在多个多模态理解基准测试中表现优异。
下载量 23
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2 是一种高效的视觉模型,通过多模态自回归目标进行预训练,在图像分类、目标检测等任务中表现出色。

模型特点

多模态自回归预训练
采用多模态自回归目标进行预训练,提升模型理解能力
高性能表现
在多个基准测试中优于CLIP、SigLIP和DINOv2等模型
大规模扩展能力
预训练方法简单直接,能有效扩展训练规模

模型能力

图像特征提取
图像分类
开放词汇目标检测
指代表达理解

使用案例

计算机视觉
图像分类
在ImageNet等数据集上进行高精度图像分类
ImageNet-1k准确率89.2%
细粒度分类
在特定领域数据集如stanford-cars上进行分类
stanford-cars准确率96.6%
医学影像
病理图像分析
在camelyon17等医学影像数据集上进行分析
camelyon17准确率93.2%