V

Videomae Base Finetuned

由 LouisDT 开发
基于VideoMAE基础模型在未知数据集上微调的视频理解模型,在评估集上达到86.41%的准确率
下载量 15
发布时间 : 2/8/2023
模型介绍
内容详情
替代品

模型简介

该模型是VideoMAE基础架构的微调版本,主要用于视频内容理解任务,具体应用场景需进一步补充

模型特点

高效视频表示学习
采用掩码自编码器架构,能有效学习视频的时空特征表示
微调性能优异
在评估集上达到86.41%的准确率,表现良好
轻量级训练
使用8的批次大小即可进行有效训练

模型能力

视频特征提取
视频内容分类
时空模式识别

使用案例

视频内容分析
动作识别
识别视频中的人类动作或行为
准确率86.41%(基于评估集)
场景分类
对视频场景内容进行分类