M

Mask2former Swin Base Ade Semantic

由 facebook 开发
基于ADE20k数据集训练的通用图像分割模型,采用统一框架处理实例/语义/全景分割任务
下载量 2,811
发布时间 : 1/5/2023
模型介绍
内容详情
替代品

模型简介

Mask2Former是一种基于Transformer的通用图像分割模型,通过预测一组掩码及对应标签实现实例分割、语义分割和全景分割的统一处理。相比前代模型MaskFormer,在性能和效率上均有显著提升。

模型特点

统一分割框架
将实例分割、语义分割和全景分割统一为实例分割任务处理
高效注意力机制
采用多尺度可变形注意力Transformer替代传统像素解码器
掩码注意力解码器
引入带掩码注意力的Transformer解码器提升性能且不增加计算量
高效训练策略
通过采样点计算损失而非整张掩码,显著提升训练效率

模型能力

实例分割
语义分割
全景分割
多尺度图像分析

使用案例

计算机视觉
场景理解
对复杂场景中的物体进行精确分割和分类
可识别ADE20k数据集中的150类语义标签
自动驾驶
道路场景的实时语义分割