A

Aimv2 Huge Patch14 448

由 apple 开发
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多个基准测试中表现优异。
下载量 1,672
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2是一种高效的视觉模型,采用多模态自回归目标进行预训练,在图像分类、特征提取等任务中表现出色。

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提高模型性能
卓越的基准测试表现
在多个视觉基准测试中超越CLIP、SigLIP和DINOv2等模型
强大的识别能力
在ImageNet上达到89.5%的准确率,展示出色的识别性能

模型能力

图像特征提取
图像分类
多模态理解
开放词汇目标检测
指代表达理解

使用案例

计算机视觉
图像分类
对图像进行分类识别
在ImageNet-1k上准确率达88.6%
自然图像识别
识别自然场景中的物体
在iNaturalist-18上准确率达82.8%
细粒度分类
进行细粒度物体分类
在Stanford Cars上准确率达96.5%
医疗影像
病理图像分析
分析医疗病理图像
在Camelyon17上准确率达93.4%