O

Owlv2 Large Patch14

由 google 开发
OWLv2是一个零样本文本条件目标检测模型,可通过文本查询在图像中检测对象,无需特定类别的训练数据。
下载量 3,679
发布时间 : 10/13/2023
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP的开放词汇目标检测模型,使用ViT-L/14作为视觉编码器,能够通过自然语言描述检测图像中的对象。

模型特点

零样本检测能力
无需特定类别的训练数据,仅通过文本描述即可检测新类别对象
开放词汇理解
能够理解并检测训练数据中未出现的对象类别
多查询检测
支持同时使用多个文本查询进行对象检测

模型能力

图像中的对象检测
文本条件目标定位
开放词汇识别
多类别同时检测

使用案例

计算机视觉研究
零样本目标检测研究
研究模型在未见类别上的检测能力
工业应用
库存管理
通过自然语言描述检测仓库中的物品