M

Mask2former Swin Small Cityscapes Instance

由 facebook 开发
Mask2Former是基于Transformer的统一图像分割模型,采用掩码注意力机制提升性能
下载量 43
发布时间 : 1/5/2023
模型介绍
内容详情
替代品

模型简介

该模型是Mask2Former的小型版本,使用Swin Transformer作为骨干网络,专门针对Cityscapes数据集进行实例分割任务微调。它采用统一架构处理实例分割、语义分割和全景分割任务。

模型特点

统一分割架构
采用统一范式处理实例分割、语义分割和全景分割任务
掩码注意力机制
引入带掩码注意力的Transformer解码器,提升性能而不增加计算量
高效训练策略
通过采样点计算损失而非整张掩码,显著提升训练效率

模型能力

图像实例分割
多尺度特征提取
高精度物体边界识别

使用案例

自动驾驶
街景物体识别
识别城市街景中的车辆、行人等实例
在Cityscapes数据集上表现优异
智能监控
场景分析
对监控画面中的物体进行精确分割和识别