O

Owlv2 Base Patch16 Ensemble

由 google 开发
OWLv2是一种零样本文本条件目标检测模型,可通过文本查询在图像中定位对象。
下载量 932.80k
发布时间 : 10/13/2023
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP的开放世界定位模型,支持通过文本查询进行零样本目标检测,无需特定类别的训练数据即可识别图像中的对象。

模型特点

零样本检测
无需特定类别的训练数据,仅通过文本描述即可检测图像中的对象
开放词汇
支持任意文本查询,不限于预定义的类别集合
多查询支持
可同时使用多个文本查询对图像进行检测

模型能力

图像目标检测
文本条件查询
开放词汇识别

使用案例

计算机视觉研究
零样本目标检测研究
用于研究模型在未见类别上的检测能力
跨学科应用
特殊对象识别
在需要识别训练数据中不常见对象的领域应用