F

Finetuned ViT Human Action Recognition V1

由 DrishtiSharma 开发
基于Google Vision Transformer (ViT)在人体动作识别数据集上微调的图像分类模型
下载量 18
发布时间 : 9/1/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT-base-patch16-224-in21k预训练模型,在Human_Action_Recognition数据集上进行微调,专门用于人体动作识别任务。

模型特点

基于ViT架构
采用先进的Vision Transformer架构,能够有效捕捉图像中的全局关系
特定领域微调
在人体动作识别数据集上进行专门微调,优化了动作识别性能
迁移学习
利用预训练模型的视觉特征提取能力,通过微调适应特定任务

模型能力

图像分类
人体动作识别
视频帧分析

使用案例

智能监控
行为分析
监控视频中的人体行为识别与分析
体育分析
运动员动作识别
识别和分析运动员的特定动作
人机交互
手势识别
识别用户的手势动作进行交互