V

Vit Betwixt Patch32 Clip 224.tinyclip Laion400m

由 timm 开发
基于ViT架构的小型CLIP模型,适用于零样本图像分类任务,训练于LAION-400M数据集。
下载量 113
发布时间 : 3/20/2024
模型介绍
内容详情
替代品

模型简介

该模型结合了视觉Transformer(ViT)和CLIP架构,能够实现零样本图像分类,即无需特定训练即可对图像进行分类。

模型特点

零样本学习能力
无需针对特定任务进行微调即可执行图像分类任务
小规模高效
相比大型CLIP模型,该模型参数更少,适合资源有限的环境
多模态理解
能够同时理解图像和文本信息,建立两者之间的关联

模型能力

零样本图像分类
图像-文本匹配
多模态特征提取

使用案例

内容分类
社交媒体图像自动标记
自动为社交媒体上传的图像生成相关标签
提高内容分类效率,减少人工标注需求
电子商务
产品图像搜索
通过文本描述搜索相关产品图像
提升用户体验和搜索效率