R

Resnet50 Clip Gap.openai

由 timm 开发
基于CLIP模型视觉编码器部分的ResNet50变体,通过全局平均池化(GAP)提取图像特征
下载量 250
发布时间 : 12/26/2024
模型介绍
内容详情
替代品

模型简介

该模型是CLIP视觉编码器的ResNet50架构实现,专门用于图像特征提取,可作为计算机视觉任务的基础特征提取器

模型特点

CLIP视觉编码器
基于CLIP模型的视觉编码器部分,具有强大的跨模态表示能力
全局平均池化
使用全局平均池化(GAP)代替全连接层,更适合特征提取任务
预训练权重
使用OpenAI CLIP的预训练权重,具有优秀的图像表示能力

模型能力

图像特征提取
视觉表示学习

使用案例

计算机视觉
图像分类
作为基础特征提取器用于图像分类任务
图像检索
提取图像特征用于相似性搜索和检索
多模态学习
与文本模型结合用于跨模态学习任务