开源rock-paper-scissors小模型 - 免费用于教学展示目标检测原理

首页

Rock Paper Scissors

由 fairportrobotics 开发

FRC 578团队开发的YOLO v10小模型，用于教学演示，展示目标检测模型原理

目标检测 #手势识别 #教学演示 #轻量级模型

下载量 25

发布时间 : 8/3/2024

模型简介

这是一个基于YOLO v10架构的小型目标检测模型，专门用于识别石头、剪刀、布三种手势。模型主要用于教学目的，向学生展示计算机视觉和目标检测的基本原理。

模型特点

教学友好

专为教学演示设计，帮助学生理解目标检测模型的工作原理

轻量级模型

基于YOLOv10的小型实现，适合在普通硬件上运行

简单数据集

仅使用100张网络图像训练，未使用复杂的数据增强技术

模型能力

石头手势检测

布手势检测

剪刀手势检测

实时摄像头检测

使用案例

教育

计算机视觉教学

用于展示目标检测模型的基本原理和工作流程

帮助学生直观理解AI模型如何识别不同手势

娱乐

石头剪刀布游戏

可用于开发基于摄像头的石头剪刀布游戏

实现自动手势识别功能

🚀 石头剪刀布目标检测模型

本模型由FRC团队578创建，是一个基于YOLO v10的小型目标检测模型，专门为教学目的而训练，旨在向学生展示目标检测模型的工作原理。

🚀 快速开始

安装依赖

pip install ultralytics
pip install huggingface_hub

使用示例

基础用法

from ultralytics import YOLO
from huggingface_hub import hf_hub_download
from matplotlib import pyplot as plt

# 从我们的仓库加载权重
model_path = hf_hub_download(
    local_dir=".",
    repo_id="fairportrobotics/rock-paper-scissors",
    filename="model.pt"
)
model = YOLO(model_path)

# 加载测试图像
sample_path = hf_hub_download(
    local_dir=".",
    repo_id="fairportrobotics/rock-paper-scissors",
    filename="sample.jpg"
)

# 进行预测
res = model.predict(
    source=sample_path,
    project='.',
    name='detected',
    exist_ok=True,
    save=True,
    show=False,
    show_labels=True,
    show_conf=True,
    conf=0.5
)

plt.figure(figsize=(15,10))
plt.imshow(plt.imread('detected/sample.jpg'))
plt.show()

高级用法

使用网络摄像头进行实时检测：

from ultralytics import YOLO
import cv2
import math 
from huggingface_hub import hf_hub_download

# 启动网络摄像头
cap = cv2.VideoCapture(0)
cap.set(3, 640)
cap.set(4, 480)

# 从我们的仓库加载权重
model_path = hf_hub_download(
    local_dir=".",
    repo_id="fairportrobotics/rock-paper-scissors",
    filename="model.pt"
)
model = YOLO(model_path)

# 目标类别
classNames = ["rock", "paper", "scissors"]

while True:
    success, img = cap.read()
    results = model(img, stream=True)

    # 坐标
    for r in results:
        boxes = r.boxes

        for box in boxes:
            # 边界框
            x1, y1, x2, y2 = box.xyxy[0]
            x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2) # 转换为整数值

            # 在摄像头画面上绘制框
            cv2.rectangle(img, (x1, y1), (x2, y2), (255, 0, 255), 3)

            # 置信度
            confidence = math.ceil((box.conf[0]*100))/100

            # 类别名称
            cls = int(box.cls[0])

            # 目标详细信息
            org = [x1, y1]
            font = cv2.FONT_HERSHEY_SIMPLEX
            fontScale = 1
            color = (255, 0, 0)
            thickness = 2

            cv2.putText(img, classNames[cls] + " " + str(round(confidence,2)), org, font, fontScale, color, thickness)

    cv2.imshow('Webcam', img)
    if cv2.waitKey(1) == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

✨ 主要特性

教育用途：专为教学设计，帮助学生理解目标检测模型的工作原理。
YOLO v10架构：基于先进的YOLO v10小型模型。

📦 安装指南

使用pip安装所需的库：

pip install ultralytics
pip install huggingface_hub

📚 详细文档

训练数据

该模型在网上收集的100张图像上进行训练，未对图像进行任何增强处理。

评估指标

类别	图像数量	实例数量	框精度	召回率	mAP50	mAP50 - 95
全部	100	260	0.917	0.795	0.925	0.735
石头	69	84	0.875	0.835	0.924	0.728
布	56	65	0.899	0.815	0.909	0.721
剪刀	88	111	0.976	0.736	0.943	0.755

📄 许可证

本项目采用GPL许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文