V

Videomae Small Finetuned Kinetics

由 MCG-NJU 开发
VideoMAE是视频领域的掩码自编码器模型,通过自监督预训练并在Kinetics-400数据集上进行监督微调,适用于视频分类任务。
下载量 2,152
发布时间 : 4/16/2023
模型介绍
内容详情
替代品

模型简介

该模型基于掩码自编码器架构,专门用于视频分类任务,能够识别Kinetics-400数据集中的400种动作类别。

模型特点

自监督预训练
通过1600个周期的自监督预训练学习视频内部表示
高效视频分类
在Kinetics-400数据集上微调后,能够准确识别400种动作类别
掩码自编码器架构
采用掩码自编码器方法进行视频预训练,提高数据效率

模型能力

视频分类
动作识别
视频特征提取

使用案例

视频内容分析
动作识别
识别视频中的人类动作
在Kinetics-400测试集上达到79.0的top-1准确率
视频分类
将视频分类到400个预定义类别中
在Kinetics-400测试集上达到93.8的top-5准确率