M

Mobilevit Small

由 apple 开发
MobileViT是一种轻量级、低延迟的视觉Transformer模型,结合了CNN和Transformer的优势,适用于移动端设备。
下载量 894.23k
发布时间 : 5/30/2022
模型介绍
内容详情
替代品

模型简介

MobileViT是一种轻量级的卷积神经网络,结合了MobileNetV2风格的层与Transformer模块,用于图像分类任务。

模型特点

轻量级设计
模型参数量仅为5.6M,适合移动端部署。
结合CNN和Transformer
融合了CNN的局部特征提取能力和Transformer的全局建模能力。
无需位置编码
模型设计不需要位置编码,简化了实现。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
ImageNet图像分类
将图像分类为1000个ImageNet类别之一。
Top-1准确率78.4%,Top-5准确率94.1%