O

Owlv2 Large Patch14 Finetuned

由 google 开发
OWLv2是一个零样本文本条件目标检测模型,可通过文本查询在图像中检测物体,无需特定类别的训练数据。
下载量 1,434
发布时间 : 10/14/2023
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP骨干网络的零样本文本条件目标检测模型,能够通过一个或多个文本查询在图像中检测物体。它使用ViT-L/14作为视觉编码器,通过对比损失训练,并在标准检测数据集上微调。

模型特点

零样本检测能力
无需特定类别的训练数据,仅通过文本查询即可检测图像中的物体。
开放词汇分类
通过替换固定分类层权重为文本嵌入,支持任意类名的检测。
多查询检测
支持使用一个或多个文本查询同时检测图像中的不同物体。

模型能力

文本条件目标检测
开放词汇物体识别
多类别同时检测

使用案例

计算机视觉研究
零样本目标检测研究
用于研究模型在未见类别上的检测能力。
跨学科应用
特殊场景物体识别
在训练数据难以获取的特殊领域(如医疗、工业)进行物体检测。