许可协议: 其他
标签:
数据集:
微件示例:
- 图片链接: https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg
示例标题: 房屋
- 图片链接: https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000002.jpg
示例标题: 城堡
MaskFormer
基于ADE20k语义分割数据集训练的MaskFormer模型(基础版,Swin骨干网络)。该模型源自论文《Per-Pixel Classification is Not All You Need for Semantic Segmentation》,并首次发布于此代码库。
免责声明:MaskFormer研发团队未提供本模型的说明文档,本文档由Hugging Face团队撰写。
模型描述
MaskFormer采用统一范式处理实例分割、语义分割和全景分割任务:通过预测一组掩码及其对应标签。因此,所有三类任务均被视作实例分割问题。

使用场景与限制
该特定检查点可用于语义分割任务。访问模型中心可查看其他任务的微调版本。
使用方法
使用方式如下:
from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests
url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-base-ade")
inputs = feature_extractor(images=image, return_tensors="pt")
model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-base-ade")
outputs = model(**inputs)
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits
predicted_semantic_map = feature_extractor.post_process_semantic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]
更多代码示例详见官方文档。