M

Mobilevit Small

由 Matthijs 开发
MobileViT是一种轻量级、低延迟的视觉Transformer模型,结合了CNN和Transformer的优势,适用于移动端设备。
下载量 39
发布时间 : 5/11/2022
模型介绍
内容详情
替代品

模型简介

MobileViT是一种轻量级卷积神经网络,结合了MobileNetV2风格的层与Transformer模块,用于图像分类任务。

模型特点

轻量级设计
专为移动端设备优化,具有低延迟和高效能的特点。
结合CNN和Transformer
融合了CNN的局部特征提取能力和Transformer的全局处理能力。
无需位置编码
模型设计无需传统Transformer中的位置编码。

模型能力

图像分类
多尺度特征提取

使用案例

计算机视觉
物体识别
识别图像中的物体类别
在ImageNet-1k上达到78.4%的top-1准确率
场景分类
对图像场景进行分类