D

Detr Resnet 50 Dc5

由 facebook 开发
DETR是一个基于Transformer架构的端到端目标检测模型,使用ResNet-50作为骨干网络,并在COCO数据集上训练。
下载量 4,038
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于目标检测任务,能够识别图像中的对象并标注其边界框。采用Transformer编码器-解码器结构,结合卷积骨干网络,使用对象查询机制检测图像中的对象。

模型特点

端到端目标检测
无需复杂的后处理步骤(如非极大值抑制),直接输出检测结果。
基于Transformer架构
利用Transformer的自注意力机制处理图像特征,实现全局上下文理解。
对象查询机制
使用100个对象查询来检测图像中的对象,每个查询负责寻找特定对象。
二分匹配损失
采用匈牙利算法进行预测与真实标注的匹配,优化模型训练过程。

模型能力

目标检测
边界框预测
多类别识别

使用案例

计算机视觉
通用目标检测
在自然场景图像中检测常见物体,如人、动物、交通工具等。
在COCO验证集上达到43.3 AP
场景理解
分析复杂场景中的对象分布和空间关系。