V

Videomae Base Ipm All Videos

由 rickysk 开发
基于VideoMAE基础模型在未知视频数据集上微调的视觉模型,主要用于视频理解任务,在评估集上达到85.59%的准确率。
下载量 30
发布时间 : 6/2/2023
模型介绍
内容详情
替代品

模型简介

该模型是VideoMAE基础模型的微调版本,专注于视频内容分析任务。通过自监督预训练和下游任务微调,能够有效捕捉视频中的时空特征。

模型特点

高效视频特征提取
采用掩码自编码预训练策略,能有效学习视频的时空表示
迁移学习能力强
基于大规模预训练模型微调,适应特定视频分析任务
平衡的性能表现
在评估集上达到85.59%的准确率,损失值为0.4713

模型能力

视频内容理解
视频分类
时空特征提取

使用案例

视频分析
视频内容分类
对视频片段进行自动分类识别
评估准确率85.59%
行为识别
识别视频中的人类行为或活动