T

Timesformer Base Finetuned K600

由 onnx-community 开发
TimeSformer 是一个基于 Transformer 架构的视频理解模型,专门用于处理视频分类任务。
下载量 16
发布时间 : 8/9/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于 Transformer 架构的视频分类模型,经过 Kinetics-600 数据集微调,适用于视频动作识别任务。

模型特点

基于 Transformer 的视频理解
利用 Transformer 架构处理视频序列,有效捕捉时空特征。
Kinetics-600 微调
在大型视频数据集 Kinetics-600 上进行了微调,具有较好的视频动作识别能力。
ONNX 兼容
提供 ONNX 格式权重,便于在网页端使用 Transformers.js 进行部署。

模型能力

视频分类
动作识别
时空特征提取

使用案例

视频分析
动作识别
识别视频中人物的动作类型,如跑步、跳舞等。
行为分析
分析视频中的行为模式,用于监控或体育分析。