V

Vit Base Movie Scenes V1

由 dingusagar 开发
基于google/vit-base-patch16-224-in21k微调的视觉模型,专门用于识别蝙蝠侠和哈利·波特电影场景图像
下载量 72
发布时间 : 7/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Vision Transformer架构的图像分类模型,针对特定电影场景进行了优化

模型特点

电影场景识别
专门针对蝙蝠侠和哈利·波特电影场景优化的图像分类能力
基于ViT架构
采用Vision Transformer基础架构,具有强大的图像特征提取能力
轻量级微调
在预训练模型基础上仅进行一轮微调,保持模型效率

模型能力

电影场景图像分类
特定电影角色识别
场景特征提取

使用案例

影视内容分析
电影场景分类
自动识别和分类蝙蝠侠或哈利·波特电影中的场景
影视内容检索
基于视觉内容的电影片段检索系统
教育娱乐
电影知识问答系统
结合视觉识别的电影知识互动应用