D

Detr Resnet 50 Panoptic

由 facebook 开发
DETR是基于Transformer架构的端到端目标检测模型,采用ResNet-50作为骨干网络,在COCO数据集上训练,支持目标检测和全景分割任务。
下载量 9,586
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

DEtection TRansformer (DETR) 是一个基于COCO 2017全景数据集训练的端到端模型,采用编码器-解码器Transformer架构,结合卷积骨干网络,通过对象查询机制实现目标检测和分割。

模型特点

端到端目标检测
无需传统目标检测模型中的锚框和非极大值抑制(NMS)等复杂后处理步骤,直接输出检测结果。
Transformer架构
采用编码器-解码器Transformer结构,利用自注意力机制处理全局上下文信息。
对象查询机制
通过100个固定的对象查询预测图像中的目标,每个查询对应一个特定对象。
二分匹配损失
使用匈牙利算法建立预测与真实标注间的最优一对一映射,优化模型训练。

模型能力

目标检测
全景分割
图像分析

使用案例

计算机视觉
体育赛事分析
检测和分割足球比赛中的球员、球和场地元素
动物识别
识别和分割图像中的不同动物种类
场景理解
分析建筑工地等复杂场景中的各类物体