M

Maskformer Swin Base Coco

由 facebook 开发
基于Swin骨干网络、在COCO数据集上训练的全景分割模型,统一处理实例/语义/全景分割任务
下载量 3,855
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

MaskFormer通过预测一组掩码及其对应标签,将分割任务统一视为实例分割问题。该检查点专为语义分割任务优化。

模型特点

统一分割范式
将实例/语义/全景分割统一为掩码预测问题,简化任务处理流程
Swin骨干网络
采用高效的Swin Transformer作为特征提取骨干,兼顾全局上下文与局部细节
端到端训练
直接预测二进制掩码和类别标签,无需依赖ROI操作或后处理分组

模型能力

图像语义分割
实例级对象识别
全景场景解析

使用案例

计算机视觉
场景理解
对复杂场景中的物体进行像素级分类和分割
可输出带有语义标签的分割掩码图
自动驾驶
实时解析道路场景中的可行驶区域、车辆及行人