T

Timesformer Base Finetuned K600

由 facebook 开发
TimeSformer是基于Kinetics-600数据集预训练的视频分类模型,采用时空注意力机制处理视频数据。
下载量 4,026
发布时间 : 10/7/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于将视频分类为Kinetics-600数据集中的600个可能类别之一,采用Transformer架构处理视频的时空特征。

模型特点

时空注意力机制
采用Transformer架构同时处理视频的空间和时间维度信息
大规模预训练
基于Kinetics-600数据集进行预训练,包含600种动作类别
端到端视频理解
直接从原始视频帧学习时空特征,无需手工设计特征

模型能力

视频分类
动作识别
时空特征提取

使用案例

视频内容分析
动作识别
识别视频中人物的动作类别
可识别Kinetics-600中的600种动作
视频内容分类
对视频内容进行自动分类
智能监控
异常行为检测
检测监控视频中的异常行为