videomae-base-finetuned-kinetics-0409开源视频理解模型

首页

Videomae Base Finetuned Kinetics 0409 Final 5sec Org Ab7 Val Inside Train

由 d2o2ji 开发

该模型是基于MCG-NJU/videomae-base-finetuned-kinetics微调的版本，主要用于视频理解任务，在评估集上取得了91.38%的准确率。

视频处理

Transformers

#视频动作识别 #高准确率 #微调模型

下载量 17

发布时间 : 4/9/2025

模型简介

这是一个基于VideoMAE架构的视频理解模型，经过微调后可用于视频动作识别等任务。

模型特点

高准确率

在评估集上达到了91.38%的准确率

基于VideoMAE架构

采用自监督学习的视频掩码自编码器架构

微调版本

基于MCG-NJU/videomae-base-finetuned-kinetics进一步微调

模型能力

视频动作识别

视频内容理解

使用案例

视频分析

动作识别

识别视频中的人类动作

准确率91.38%

行为分析

分析视频中的行为模式

🚀 视频MAE基础模型微调Kinetics数据集 - 0409最终版5秒原始数据ab7验证集包含在训练集中

该模型是 MCG-NJU/videomae-base-finetuned-kinetics 在未知数据集上的微调版本。它在评估集上取得了以下结果：

损失值：0.3255
准确率：0.9138

🚀 快速开始

本模型可用于视频相关的任务，基于微调的基础模型，能在视频分析等场景中提供较好的性能。

📚 详细文档

模型描述

该模型是对基础模型在特定未知数据集上进行微调得到的，目前更多详细信息待补充。

预期用途与限制

目前关于该模型的预期用途和限制的更多信息待补充。

训练和评估数据

目前关于训练和评估数据的更多信息待补充。

训练过程

训练超参数

训练过程中使用了以下超参数：

学习率：5e - 05
训练批次大小：8
评估批次大小：8
随机种子：42
优化器：使用 adamw_torch，其中 betas=(0.9, 0.999)，epsilon=1e - 08，无额外优化器参数
学习率调度器类型：线性
学习率调度器热身比例：0.05
训练步数：67100

训练结果

训练损失	轮数	步数	验证损失	准确率
0.4404	0.0100	672	0.2641	0.8958
0.0506	1.0100	1344	0.2971	0.9045
0.0077	2.0100	2016	0.8203	0.8293
0.016	3.0100	2688	0.4447	0.8958
0.0012	4.0100	3360	0.5228	0.8622
0.0003	5.0100	4032	0.5333	0.8731
0.0019	6.0100	4704	0.5615	0.8786
0.0669	7.0100	5376	0.3206	0.9162
0.0056	8.0100	6048	0.5627	0.8849
0.0003	9.0100	6720	0.6655	0.8567
0.0063	10.0100	7392	0.6566	0.8786
0.0003	11.0100	8064	0.5058	0.8778
0.0005	12.0100	8736	0.4329	0.9045
0.0005	13.0100	9408	0.4837	0.8943
0.0182	14.0100	10080	0.6702	0.8692
0.0001	15.0100	10752	0.7277	0.8583
0.0001	16.0100	11424	0.6110	0.8763
0.0001	17.0100	12096	0.5027	0.9146
0.0006	18.0100	12768	0.4604	0.9068
0.0138	19.0100	13440	0.4703	0.9123
0.0	20.0100	14112	0.4712	0.9068
0.5385	21.0100	14784	0.5793	0.9021
0.0001	22.0100	15456	0.4995	0.9162

框架版本

Transformers 4.48.1
Pytorch 2.5.1+cu121
Datasets 3.2.0
Tokenizers 0.21.0

📄 许可证

本模型使用的许可证为 cc - by - nc - 4.0。

📋 模型信息表格

属性	详情
模型类型	视频MAE基础模型微调Kinetics数据集 - 0409最终版5秒原始数据ab7验证集包含在训练集中
基础模型	MCG - NJU/videomae - base - finetuned - kinetics
生成方式	由训练器自动生成
评估指标	准确率