M

Mask2former Swin Base Coco Panoptic

由 facebook 开发
基于Swin骨干网络的Mask2Former模型,在COCO全景分割数据集上训练,采用统一范式处理实例分割、语义分割和全景分割任务。
下载量 45.01k
发布时间 : 1/2/2023

模型简介

Mask2Former是一种通用图像分割模型,通过预测一组掩码及其对应标签,将实例分割、语义分割和全景分割任务统一处理。相比前代模型在性能和效率上均有突破。

模型特点

统一分割范式
将实例分割、语义分割和全景分割统一视为掩码预测问题,简化了任务处理流程。
多尺度可变形注意力
升级像素解码器采用多尺度可变形注意力机制,提升特征提取能力。
掩码注意力解码器
采用带掩码注意力的变换器解码器,以零计算成本提升模型性能。
高效训练策略
通过子采样点计算损失而非全掩码,显著提升训练效率。

模型能力

图像分割
实例分割
语义分割
全景分割

使用案例

计算机视觉
场景理解
对复杂场景中的物体进行精确分割和分类
可同时识别物体实例和语义类别
自动驾驶
道路场景解析,识别车辆、行人、道路等元素
提供精确的物体边界和类别信息
AIbase
智启未来,您的人工智能解决方案智库
简体中文