Y

Yoloe

由 jameslahm 开发
YOLOE是一个高效、统一且开放的目标检测与分割模型,支持文本、视觉输入及无提示范式等多种提示机制,实现实时全能视觉感知。
下载量 40.34k
发布时间 : 3/10/2025
模型介绍
内容详情
替代品

模型简介

YOLOE将多种开放提示机制下的检测与分割功能集成于单一高效模型中,针对文本提示提出可重参数化的区域-文本对齐策略,对于视觉提示设计语义激活的视觉提示编码器,针对无提示场景开发惰性区域-提示对比策略。

模型特点

多种提示机制
支持文本提示、视觉输入及无提示范式等多种提示机制
高效实时处理
在保持高推理效率和低训练成本的同时,实现实时视觉感知
可重参数化设计
提出可重参数化的区域-文本对齐策略,实现零推理和迁移开销
开放场景适应
突破传统YOLO模型的预定义类别限制,适应开放场景

模型能力

目标检测
图像分割
文本提示识别
视觉提示识别
无提示对象识别

使用案例

智能监控
开放场景物体识别
在监控场景中识别各种物体,不受预定义类别限制
可准确识别各类物体,包括罕见或新出现的对象
自动驾驶
实时道路物体检测
在自动驾驶系统中实时检测道路上的各种物体
高精度识别各类交通参与者,处理速度快
工业质检
缺陷检测
通过视觉提示识别产品缺陷
可适应不同类型产品的缺陷检测需求