D-FINE-xlarge-obj2coco开源目标检测模型 - 高精度定位物体超实用

首页

Dfine Xlarge Obj2coco

由 ustc-community 开发

D-FINE是一个用于目标检测的模型，通过重新定义DETR模型中的边界框回归任务，实现了出色的定位精度。

目标检测

Transformers

英语开源协议:Apache-2.0 #细粒度目标检测 #边界框回归优化 #自动驾驶适配

下载量 4,191

发布时间 : 3/28/2025

模型简介

D-FINE是一个强大的实时目标检测器，通过细粒度分布细化（FDR）和全局最优定位自蒸馏（GO-LSD）两个关键组件，提升了目标检测的定位精度。

模型特点

细粒度分布细化（FDR）

重新定义边界框回归任务，提升定位精度。

全局最优定位自蒸馏（GO-LSD）

通过自蒸馏技术优化模型性能。

实时目标检测

适用于需要实时处理的场景，如自动驾驶和监控系统。

模型能力

目标检测

实时处理

高精度定位

使用案例

自动驾驶

车辆和行人检测

在自动驾驶系统中实时检测车辆和行人。

高精度的定位能力提升自动驾驶安全性。

监控系统

异常行为检测

在监控视频中检测异常行为或可疑物体。

实时处理能力确保及时响应。

零售分析

商品识别

在零售环境中识别和定位商品。

高精度检测提升库存管理和顾客体验。

🚀 D-FINE

D-FINE是一个用于目标检测的模型，它通过重新定义DETR模型中的边界框回归任务，实现了出色的定位精度，可应用于自动驾驶、监控系统等多个领域。

🚀 快速开始

D-FINE模型由Yansong Peng、Hebei Li等人在论文 D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement 中提出。此模型由 VladOS95-cyber 在 @qubvel-hf 的帮助下贡献，这是D-FINE在HF transformers库中的实现。

以下是使用该模型进行目标检测的代码示例：

import torch
import requests

from PIL import Image
from transformers import DFineForObjectDetection, AutoImageProcessor

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

image_processor = AutoImageProcessor.from_pretrained("ustc-community/dfine-xlarge-obj2coco")
model = DFineForObjectDetection.from_pretrained("ustc-community/dfine-xlarge-obj2coco")

inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
    outputs = model(**inputs)

results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([image.size[::-1]]), threshold=0.3)

for result in results:
    for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
        score, label = score.item(), label_id.item()
        box = [round(i, 2) for i in box.tolist()]
        print(f"{model.config.id2label[label]}: {score:.2f} {box}")