deeplabv3_mobilenet_v2_1.0_513开源语义分割模型

首页

Deeplabv3 Mobilenet V2 1.0 513

由 Matthijs 开发

基于MobileNetV2架构并添加DeepLabV3+头部的语义分割模型，在PASCAL VOC数据集上预训练

图像分割

Transformers

开源协议:其他 #移动端图像分割 #低功耗模型 #实时语义分割

下载量 164

发布时间 : 6/28/2022

模型简介

这是一个轻量级的语义分割模型，结合了MobileNetV2的高效性和DeepLabV3+的精确分割能力，适用于移动设备和资源受限环境。

模型特点

轻量高效

基于MobileNetV2架构，专为移动设备优化，具有低延迟和低功耗特性

精确分割

结合DeepLabV3+头部，提供高质量的语义分割结果

预训练模型

已在PASCAL VOC数据集上以513x513分辨率预训练，可直接使用

模型能力

图像语义分割

物体边界识别

场景理解

使用案例

计算机视觉

自动驾驶场景分割

用于识别道路、行人、车辆等关键元素

医学图像分析

可用于医学图像中的器官或病变区域分割

🚀 MobileNetV2 with DeepLabV3+

本项目是在PASCAL VOC数据集上以513x513分辨率预训练的MobileNet V2模型。它由Mark Sandler、Andrew Howard、Menglong Zhu、Andrey Zhmoginov和Liang - Chieh Chen在论文MobileNetV2: Inverted Residuals and Linear Bottlenecks中提出，并首次在该仓库发布。此模型卡由Hugging Face团队编写，因为发布MobileNet V2的团队并未为该模型撰写模型卡。

✨ 主要特性

轻量级设计：MobileNet是小型、低延迟、低功耗的模型，可根据不同用例的资源限制进行参数配置。
多功能应用：可用于分类、检测、嵌入和分割等任务，类似于其他流行的大规模模型（如Inception）。
高效运行：能够在移动设备上高效运行，在延迟、模型大小和准确性之间进行权衡，与文献中的流行模型相比具有优势。
语义分割能力：本仓库中的模型在MobileNetV2骨干网络上添加了DeepLabV3+头部，用于语义分割任务。

📚 详细文档

模型描述

引用自原始README：

MobileNet是小型、低延迟、低功耗的模型，其参数化设计旨在满足各种用例的资源限制。它们可以像其他流行的大规模模型（如Inception）一样，用于构建分类、检测、嵌入和分割等任务。MobileNet可以在移动设备上高效运行，在延迟、大小和准确性之间进行权衡，并且与文献中的流行模型相比具有优势。

本仓库中的模型在MobileNetV2骨干网络上添加了DeepLabV3+头部，用于语义分割。

预期用途和限制

你可以使用该原始模型进行语义分割。你可以在模型中心查找针对你感兴趣的任务进行微调的版本。

💻 使用示例

基础用法

from transformers import MobileNetV2FeatureExtractor, MobileNetV2ForSemanticSegmentation
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

feature_extractor = MobileNetV2FeatureExtractor.from_pretrained("Matthijs/deeplabv3_mobilenet_v2_1.0_513")
model = MobileNetV2ForSemanticSegmentation.from_pretrained("Matthijs/deeplabv3_mobilenet_v2_1.0_513")

inputs = feature_extractor(images=image, return_tensors="pt")

outputs = model(**inputs)
logits = outputs.logits
predicted_mask = logits.argmax(1).squeeze(0)

目前，特征提取器和模型都支持PyTorch。

BibTeX引用

@inproceedings{deeplabv3plus2018,
  title={Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation},
  author={Liang-Chieh Chen and Yukun Zhu and George Papandreou and Florian Schroff and Hartwig Adam},
  booktitle={ECCV},
  year={2018}
}