O

Owlv2 Large Patch14 Ensemble

由 Thomasboosinger 开发
OWLv2是一种零样本文本条件目标检测模型,可通过文本查询检测图像中的对象。
下载量 1
发布时间 : 2/19/2024
模型介绍
内容详情
替代品

模型简介

OWLv2是基于CLIP主干网络的开放词汇目标检测模型,能够通过文本查询在图像中检测未在训练中见过的对象类别。

模型特点

零样本检测能力
无需特定类别的训练数据,仅通过文本描述即可检测新类别对象
开放词汇表
支持任意文本查询作为检测类别,不限于预定义的类别集合
多模态架构
结合视觉和语言模型,实现图像与文本的联合理解

模型能力

零样本目标检测
图像理解
文本条件视觉搜索
多对象检测

使用案例

计算机视觉研究
零样本检测研究
用于研究模型在未见类别上的泛化能力
跨学科应用
特殊对象识别
在医疗、农业等领域识别训练数据中不常见的特殊对象