C

CLIP ViT L 14 Spectrum Icons 20k

由 JianLiao 开发
基于CLIP ViT-L/14微调的视觉语言模型,专为抽象图像-文本检索任务优化
下载量 1,576
发布时间 : 1/5/2025
模型介绍
内容详情
替代品

模型简介

该模型在23,000个抽象图像-文本对上微调,提升了文本到图像和图像到文本检索性能,特别适合处理抽象视觉特征

模型特点

抽象视觉特征理解
通过专用数据集微调,增强了对抽象图标和符号的理解能力
高效检索能力
在图像-文本双向检索任务中R@1达到70%,R@5超过96%
领域适应性
保持基础模型泛化能力的同时,优化了特定领域的表现

模型能力

零样本图像分类
文本到图像检索
图像到文本检索
抽象视觉特征匹配

使用案例

信息检索
图标库搜索
通过自然语言描述检索匹配的图标图像
R@1准确率约70%
内容管理
自动图像标注
为抽象图标生成描述性文本标签