D

Deformable Detr Box Supervised

由 facebook 开发
Deformable DETR是基于Transformer架构的目标检测模型,在LVIS数据集上训练,支持1203个类别的物体检测。
下载量 193
发布时间 : 2/27/2023
模型介绍
内容详情
替代品

模型简介

该模型采用Deformable DETR架构,结合卷积骨干网络和Transformer编码器-解码器,通过对象查询机制实现高效的目标检测。

模型特点

大规模类别检测
支持LVIS数据集的1203个物体类别检测,包括稀有类别。
高效Transformer架构
采用Deformable DETR架构,通过可变形注意力机制提高计算效率。
端到端训练
无需复杂的后处理,直接输出检测结果。

模型能力

多类别物体检测
边界框预测
大规模视觉识别

使用案例

通用物体检测
场景理解
检测复杂场景中的多种物体
在LVIS数据集上达到31.7 mAP
稀有物体检测
识别不常见的物体类别
稀有类别mAP达到21.4