O

Owlvit Base Patch16

由 google 开发
OWL-ViT是一个零样本文本条件目标检测模型,可通过文本查询在图像中检测物体。
下载量 4,588
发布时间 : 7/5/2022
模型介绍
内容详情
替代品

模型简介

OWL-ViT是基于CLIP骨干网络的零样本文本条件目标检测模型,能够通过一个或多个文本查询在图像中检测物体,无需针对特定类别进行训练。

模型特点

零样本检测能力
无需针对特定类别进行训练,即可通过文本查询检测新物体
多文本查询支持
支持使用一个或多个文本查询同时检测图像中的不同物体
开放词汇分类
通过替换固定分类层权重为文本嵌入,实现开放词汇分类

模型能力

零样本文本条件目标检测
图像物体定位
多类别同时检测

使用案例

计算机视觉研究
零样本目标检测研究
用于研究模型在未见类别上的检测能力
跨学科应用
特殊物体识别
在需要识别训练期间标签不可用物体的领域应用