V

Videomae Base Finetuned

由 sheraz179 开发
基于MCG-NJU/videomae-base在未知数据集上微调的视频理解模型,F1分数达到0.7147
下载量 15
发布时间 : 2/8/2023
模型介绍
内容详情
替代品

模型简介

该模型是VideoMAE基础架构的微调版本,专注于视频内容理解任务,可能应用于视频分类或行为识别等场景

模型特点

高效视频表示学习
基于VideoMAE架构,通过掩码自编码预训练有效学习视频时空特征
微调性能优异
在评估集上达到0.7147的F1分数,表明模型具有较强的判别能力
轻量级训练
使用较小的批次大小(3)进行高效微调

模型能力

视频特征提取
视频内容理解
时空模式识别

使用案例

视频分析
行为识别
识别视频中的人类行为或活动
F1分数0.7147
视频分类
对视频内容进行分类标注