I

Internvideo2 Stage2 6B

由 OpenGVLab 开发
InternVideo2是一个多模态视频理解模型,具有6B参数规模,专注于视频内容分析和理解任务。
下载量 542
发布时间 : 2/10/2025
模型介绍
内容详情
替代品

模型简介

该模型是InternVideo2项目的第二阶段训练成果,专注于视频分类和理解任务,能够处理视频内容并执行文本检索等任务。

模型特点

大规模参数
拥有6B参数规模,具备强大的视频理解能力
多模态处理
能够同时处理视频和文本信息,实现跨模态理解
高效检索
可以从视频内容中高效检索相关文本描述

模型能力

视频内容分析
视频特征提取
文本-视频检索
多模态理解

使用案例

视频内容理解
视频场景描述
分析视频内容并生成或匹配相应的文本描述
能够准确匹配视频内容与候选文本描述
智能监控
异常行为检测
分析监控视频中的异常行为