M

Mambavision L 1K

由 nvidia 开发
首个结合Mamba与Transformer优势的计算机视觉混合模型,通过重新设计Mamba公式增强视觉特征建模能力
下载量 1,542
发布时间 : 7/14/2024
模型介绍
内容详情
替代品

模型简介

MambaVision是结合Mamba与Transformer的混合视觉模型,具有分层架构,支持图像分类和特征提取任务

模型特点

混合架构创新
首次将Mamba与Transformer结合,重新设计Mamba公式以增强视觉特征建模能力
分层架构设计
提供分层架构模型系列,满足不同设计需求
性能优势
在Top-1准确率与吞吐量方面创造了新的SOTA帕累托前沿
多阶段特征提取
支持获取四个阶段的层级特征及最终平均池化特征

模型能力

图像分类
视觉特征提取
长距离空间依赖建模

使用案例

计算机视觉
通用图像分类
对输入图像进行分类识别
示例输出:'棕熊'
视觉特征提取
提取图像的多层次特征表示
可获取四个阶段的层级特征及平均池化特征