A

Aimv2 Large Patch14 336

由 apple 开发
AIMv2是基于多模态自回归目标预训练的视觉模型系列,在多项视觉任务中表现优异。
下载量 6,177
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2采用多模态自回归目标预训练方法,在图像分类等视觉任务中展现出强大的性能,支持多种视觉数据集的处理。

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提升模型性能
卓越的分类性能
在ImageNet等多项基准测试中超越同类模型
广泛的数据集支持
支持从自然图像到医学影像等多种类型的数据集

模型能力

图像特征提取
多类别图像分类
跨领域视觉理解

使用案例

计算机视觉
通用图像分类
对自然图像进行分类识别
在ImageNet-1k上达到87.6%准确率
细粒度分类
对特定领域的精细分类任务
在Stanford Cars上达到96.7%准确率
医学影像分析
处理医学影像分类任务
在Camelyon17上达到93.8%准确率