Maskformer Swin Tiny Ade

由 facebook 开发

基于ADE20k数据集训练的语义分割模型，采用统一框架处理实例/语义/全景分割任务

图像分割

Transformers

开源协议:其他 #统一分割框架 #Swin骨干网络 #语义分割

下载量 5,196

发布时间 : 3/2/2022

模型介绍

内容详情

替代品

模型简介

MaskFormer通过预测一组掩码及其对应标签来实现分割任务，将三类分割问题统一为实例分割框架

模型特点

统一分割框架

将实例分割、语义分割和全景分割统一为相同的预测范式

Swin骨干网络

采用高效的Swin Transformer作为特征提取器

掩码预测机制

通过预测二进制掩码和对应类别实现像素级分割

模型能力

图像语义分割

像素级分类

场景理解

使用案例

场景解析

建筑场景分割

识别并分割建筑图像中的不同结构元素

示例显示对房屋/城堡等建筑的准确分割效果

室内场景分析

解析室内空间中的家具和装饰元素

许可证：其他标签：

视觉
图像分割数据集：
scene_parse_150 微件示例：
图片地址：https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg 示例标题：房屋
图片地址：https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000002.jpg 示例标题：城堡

MaskFormer模型

基于ADE20k语义分割数据集训练的MaskFormer模型（微型版本，Swin骨干网络）。该模型首次发表于论文《Per-Pixel Classification is Not All You Need for Semantic Segmentation》，并开源在此代码库。

免责声明：MaskFormer研发团队未提供本模型的说明卡片，本文档由Hugging Face团队撰写。

模型描述

MaskFormer采用统一框架处理实例分割、语义分割和全景分割任务：通过预测一组掩码及其对应标签来实现。因此，所有三类任务都被视为实例分割问题。

模型架构图

使用场景与限制

当前检查点适用于语义分割任务。访问模型中心可探索其他任务的微调版本。

使用方法

使用方式如下：

from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests

url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-tiny-ade")
inputs = feature_extractor(images=image, return_tensors="pt")

model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-tiny-ade")
outputs = model(**inputs)
# 模型输出包含形状为(batch_size, num_queries)的类别查询logits
# 以及形状为(batch_size, num_queries, height, width)的掩码查询logits
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits

# 可将输出传递给feature_extractor进行后处理
# 可视化方法请参考MaskFormer文档"资源"章节的演示笔记本
predicted_semantic_map = feature_extractor.post_process_semantic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]