V

Videomae Small Finetuned Ssv2

由 MCG-NJU 开发
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,在Something-Something V2数据集上微调用于视频分类任务。
下载量 140
发布时间 : 4/16/2023
模型介绍
内容详情
替代品

模型简介

该模型通过自监督方式预训练2400个周期,并在Something-Something V2数据集上进行监督微调,能够将视频分类为174种标签之一。

模型特点

自监督预训练
采用掩码自编码器(MAE)方法进行自监督预训练,有效学习视频内部表示
高效视频处理
将视频处理为固定尺寸补丁序列,通过Transformer架构高效处理
SSV2数据集微调
在Something-Something V2数据集上微调,专门用于动作识别任务

模型能力

视频分类
动作识别
特征提取

使用案例

视频理解
动作识别
识别视频中的人类动作和行为
在SSV2测试集上达到66.8%的top-1准确率
视频内容分析
分析视频内容并自动分类