M

Model Timesformer Subset 02

由 namnh2002 开发
基于TimeSformer架构的视频理解模型,在未知数据集上微调,准确率达88.52%
下载量 15
发布时间 : 3/4/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于TimeSformer架构的视频分类模型,适用于时序视频理解任务。模型在评估集上表现出色,准确率达到88.52%。

模型特点

高准确率
在评估集上达到88.52%的准确率,表现优异
时序理解能力
基于TimeSformer架构,擅长处理视频时序信息
高效训练
采用线性学习率调度和Adam优化器,训练过程稳定高效

模型能力

视频分类
时序特征提取
视频内容理解

使用案例

视频分析
动作识别
识别视频中的人类动作或行为
准确率88.52%
场景分类
对视频内容场景进行分类