V

Vit Base Patch16 Plus Clip 240.laion400m E31

由 timm 开发
基于LAION-400M数据集训练的视觉-语言双用途模型,支持零样本图像分类任务
下载量 37.23k
发布时间 : 10/23/2024
模型介绍
内容详情
替代品

模型简介

该模型是OpenCLIP和timm框架的双用途视觉模型,采用ViT-B-16-plus架构,在LAION-400M数据集上训练完成,主要用于零样本图像分类任务。

模型特点

双框架兼容
同时支持OpenCLIP和timm框架,提供更灵活的使用方式
零样本学习
无需微调即可执行图像分类任务
大规模训练数据
基于LAION-400M数据集训练,具有强大的泛化能力

模型能力

零样本图像分类
图像特征提取
视觉-语言对齐

使用案例

图像理解
零样本图像分类
无需特定训练即可对新类别图像进行分类
内容审核
识别图像中的不当内容
多模态应用
图像检索
基于文本描述检索相关图像