N

Nat Small In1k 224

由 shi-labs 开发
NAT-Small是基于邻域注意力的分层视觉变换器,专为图像分类任务设计
下载量 6
发布时间 : 11/18/2022
模型介绍
内容详情
替代品

模型简介

NAT是一种基于邻域注意力(NA)的分层视觉变换器,采用受限自注意力机制,每个标记的感受野仅限于其最近的相邻像素,具有高度灵活性并保持平移等变性

模型特点

邻域注意力机制
采用滑动窗口注意力模式,每个标记仅关注其最近邻像素,保持计算效率的同时实现局部特征提取
平移等变性
通过邻域注意力设计,模型保持对图像平移的等变特性
分层结构
采用分层视觉变换器架构,适合处理不同尺度的视觉特征

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
ImageNet分类
将图像分类为ImageNet的1,000个类别
物体识别
识别图像中的主要物体类别