O

Owlvit Base Patch32

由 Xenova 开发
OWL-ViT是一个基于视觉Transformer的零样本目标检测模型,能够在不进行微调的情况下检测新类别的物体。
下载量 86
发布时间 : 11/13/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Transformer架构的零样本目标检测模型,能够根据提供的文本标签检测图像中的物体,无需针对特定类别进行训练。

模型特点

零样本检测能力
无需针对特定类别进行训练,即可检测新类别的物体
文本引导检测
通过文本描述指定要检测的物体类别
基于Transformer架构
采用视觉Transformer架构,结合文本和图像信息
网页端适配
提供ONNX格式权重,便于在浏览器环境中使用

模型能力

零样本目标检测
多类别物体识别
文本引导的图像分析
边界框预测

使用案例

图像分析
物体检测
在图像中检测指定类别的物体
返回检测到的物体类别、置信度和边界框坐标
内容审核
敏感内容检测
检测图像中是否存在特定类型的敏感内容