O

Owlv2 Large Patch14 Ensemble

由 google 开发
OWLv2是一个零样本文本条件目标检测模型,可通过文本查询在图像中定位对象。
下载量 262.77k
发布时间 : 10/13/2023
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP骨干网络的零样本文本条件目标检测模型,能够在没有特定训练的情况下,通过文本描述检测图像中的对象。

模型特点

零样本检测
无需特定对象类别的训练数据,即可通过文本描述检测新对象
文本条件检测
支持通过一个或多个文本查询进行图像检测
开放词汇分类
使用文本嵌入代替固定分类层,支持任意类名

模型能力

零样本目标检测
文本条件图像分析
多对象同时检测

使用案例

计算机视觉研究
零样本检测研究
研究模型在未见过的对象类别上的检测能力
跨学科应用
特殊领域对象检测
在缺乏训练数据的专业领域(如医学、工业)进行对象检测