V

Vjepa2 Vitl Fpc64 256

由 facebook 开发
V-JEPA 2是Meta旗下FAIR团队开发的前沿视频理解模型,扩展了VJEPA的预训练目标,具备业界领先的视频理解能力。
下载量 109
发布时间 : 5/31/2025

模型简介

V-JEPA 2是一个强大的视频理解模型,可用于视频分类、检索等任务,也能作为视觉语言模型(VLM)的视频编码器。

模型特点

先进的视频理解能力
扩展了VJEPA的预训练目标,具备业界领先的视频理解能力。
多模态处理
可同时处理视频和图像数据。
多功能应用
支持视频分类、检索等任务,还能作为视觉语言模型(VLM)的视频编码器。

模型能力

视频理解
视频分类
视频检索
视觉特征提取

使用案例

视频分析
视频分类
对视频内容进行分类识别。
视频检索
基于内容检索相似视频。
多模态应用
视觉语言模型编码器
作为视觉语言模型的视频编码器使用。
AIbase
智启未来,您的人工智能解决方案智库
简体中文