A

Aimv2 Large Patch14 448

由 apple 开发
AIMv2是基于多模态自回归目标预训练的视觉模型系列,在多个基准测试中表现优异
下载量 2,210
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2采用多模态自回归目标进行预训练,在图像分类、目标检测等视觉任务中展现出强大性能

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提升模型理解能力
卓越性能表现
在多个基准测试中超越CLIP、SigLIP和DINOv2等主流视觉模型
大规模扩展能力
预训练方法简单直接,能有效扩展训练规模

模型能力

图像特征提取
图像分类
多模态理解
开放词汇目标检测
指代表达理解

使用案例

计算机视觉
图像分类
在ImageNet等数据集上进行图像分类任务
在ImageNet-1k上达到87.9%准确率
细粒度分类
在特定领域的细粒度图像分类任务
在Stanford Cars上达到96.6%准确率
医学图像分析
处理医学影像分类任务
在Camelyon17上达到94.1%准确率
遥感图像处理
卫星图像分类
处理卫星和航拍图像分类任务
在EuroSAT上达到98.6%准确率