M

Mask2former Swin Large Ade Panoptic

由 facebook 开发
基于Swin大型骨干网络在ADE20k全景分割数据集上训练的Mask2Former模型,采用统一范式处理实例分割、语义分割和全景分割任务。
下载量 2,625
发布时间 : 1/5/2023

模型简介

Mask2Former是一种通用的图像分割模型,通过预测一组掩码及对应标签,将实例分割、语义分割和全景分割三大任务统一视为实例分割问题。

模型特点

统一分割范式
通过预测一组掩码及对应标签,将实例分割、语义分割和全景分割三大任务统一视为实例分割问题。
多尺度可变形注意力
采用多尺度可变形注意力Transformer升级像素解码器,提升模型性能。
掩码注意力机制
引入掩码注意力机制的Transformer解码器,提升性能而不增加计算量。
高效训练
通过子采样点计算损失显著提升训练效率。

模型能力

图像分割
实例分割
语义分割
全景分割

使用案例

计算机视觉
场景理解
用于理解复杂场景中的物体及其关系
自动驾驶
用于道路场景的物体识别和分割
AIbase
智启未来,您的人工智能解决方案智库
简体中文