finetuned-ViT-human-action-recognition-v1开源模型 - 精准实现人体动作图像分类

Finetuned ViT Human Action Recognition V1

由 DrishtiSharma 开发

基于Google Vision Transformer (ViT)在人体动作识别数据集上微调的图像分类模型

下载量 18

发布时间 : 9/1/2022

模型简介

该模型是基于Google的ViT-base-patch16-224-in21k预训练模型，在Human_Action_Recognition数据集上进行微调，专门用于人体动作识别任务。

基于ViT架构

采用先进的Vision Transformer架构，能够有效捕捉图像中的全局关系

特定领域微调

在人体动作识别数据集上进行专门微调，优化了动作识别性能

迁移学习

利用预训练模型的视觉特征提取能力，通过微调适应特定任务

图像分类

人体动作识别

视频帧分析

智能监控

行为分析

监控视频中的人体行为识别与分析

体育分析

运动员动作识别

识别和分析运动员的特定动作

人机交互

手势识别

识别用户的手势动作进行交互