O

Owlv2 Base Patch16

由 google 开发
OWLv2是一种零样本文本条件目标检测模型,可通过文本查询检索图像中的对象。
下载量 15.42k
发布时间 : 10/13/2023
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP主干网络的开放世界定位模型,支持通过文本查询进行零样本目标检测。

模型特点

零样本检测
无需特定类别训练即可通过文本查询检测新对象
开放词汇分类
通过替换分类层权重实现任意文本类别的检测
多查询支持
支持单张图像中同时搜索多个文本描述的对象

模型能力

图像目标检测
文本条件搜索
开放词汇识别

使用案例

计算机视觉研究
零样本检测研究
探索模型对未见类别的识别能力
跨学科应用
特殊领域物体识别
在缺乏标注数据的领域(如医学图像)进行物体检测