许可证:其他
标签:
- 视觉
- 图像分割
数据集:
- scene_parse_150
微件示例:
- 图片地址:https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg
示例标题:房屋
- 图片地址:https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000002.jpg
示例标题:城堡
MaskFormer模型
基于ADE20k语义分割数据集训练的MaskFormer模型(微型版本,Swin骨干网络)。该模型首次发表于论文《Per-Pixel Classification is Not All You Need for Semantic Segmentation》,并开源在此代码库。
免责声明:MaskFormer研发团队未提供本模型的说明卡片,本文档由Hugging Face团队撰写。
模型描述
MaskFormer采用统一框架处理实例分割、语义分割和全景分割任务:通过预测一组掩码及其对应标签来实现。因此,所有三类任务都被视为实例分割问题。

使用场景与限制
当前检查点适用于语义分割任务。访问模型中心可探索其他任务的微调版本。
使用方法
使用方式如下:
from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests
url = "https://huggingface.co/datasets/hf-internal-testing/fixtures_ade20k/resolve/main/ADE_val_00000001.jpg"
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-tiny-ade")
inputs = feature_extractor(images=image, return_tensors="pt")
model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-tiny-ade")
outputs = model(**inputs)
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits
predicted_semantic_map = feature_extractor.post_process_semantic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]
更多代码示例详见官方文档。