V

Vit Large Patch14 Clip 224.laion400m E31

由 timm 开发
基于LAION-400M数据集训练的Vision Transformer大型模型,支持零样本图像分类任务
下载量 21.15k
发布时间 : 10/23/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个双用途视觉模型,同时兼容OpenCLIP和timm框架,主要用于图像分类任务,特别擅长零样本学习场景

模型特点

双框架兼容
同时支持OpenCLIP和timm框架,提供更灵活的使用方式
零样本学习
无需特定领域训练即可完成图像分类任务
大规模训练数据
基于LAION-400M数据集训练,具有广泛的视觉概念理解能力

模型能力

零样本图像分类
视觉特征提取
跨模态理解

使用案例

图像分析
通用物体识别
对图像中的常见物体进行分类识别
在开放域图像分类任务中表现良好
内容审核
自动识别图像中的不当内容
可有效识别多种类型的敏感内容
跨模态应用
图文匹配
评估图像与文本描述的匹配程度