V

Videomae Base Ssv2

由 MCG-NJU 开发
VideoMAE是基于掩码自编码器的自监督视频预训练模型,在Something-Something-v2数据集上预训练2400轮。
下载量 454
发布时间 : 8/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过自监督方式学习视频内部表征,适用于视频分类等下游任务的微调。

模型特点

自监督预训练
采用掩码自编码器方法,无需标注数据进行预训练
高效视频学习
通过掩码视频块预测任务学习视频表征
基于ViT架构
采用视觉Transformer架构,适合处理视频序列数据

模型能力

视频特征提取
视频掩码块预测
视频分类任务微调

使用案例

视频理解
视频分类
在预训练模型基础上微调用于视频分类任务
视频表征学习
提取视频特征用于下游任务