A

Aimv2 3B Patch14 224

由 apple 开发
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多项基准测试中表现优异
下载量 57
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

AIMv2是一个强大的视觉模型,通过多模态自回归目标进行预训练,在图像分类和理解任务中表现出色

模型特点

多模态自回归预训练
采用创新的多模态自回归目标进行预训练,提高模型理解能力
卓越的分类性能
在ImageNet等多项基准测试中达到顶尖准确率
大规模参数
3B参数的强大模型,能够捕捉更丰富的视觉特征

模型能力

图像特征提取
图像分类
多模态理解
开放词汇目标检测
指代表达理解

使用案例

计算机视觉
通用图像分类
在ImageNet等标准数据集上进行图像分类
ImageNet-1k准确率88.5%
细粒度分类
在stanford-cars等细粒度分类任务中的应用
stanford-cars准确率96.5%
医学图像分析
在camelyon17等医学图像数据集上的应用
camelyon17准确率93.5%