C

Clip Vit B 32 Japanese V1

由 sonoisa 开发
这是一个适用于日语的CLIP文本/图像编码器模型,通过蒸馏技术将英语版CLIP模型转换为日语版本。
下载量 690
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个多模态模型,能够处理日语文本和图像,用于计算文本与图像的相似度、生成嵌入表示等任务。

模型特点

日语支持
专门针对日语优化的文本编码器,能够更好地处理日语文本。
多模态处理
能够同时处理文本和图像数据,计算它们之间的相似度。
蒸馏技术
通过蒸馏技术从英语CLIP模型转换而来,保留了原模型的强大能力。

模型能力

计算文本-图像相似度
生成文本嵌入
生成图像嵌入
多模态搜索
零样本分类

使用案例

图像搜索
いらすとや图像的多模态搜索
使用日语文本描述搜索相关图像
零样本搜索效果良好
多模态分类
结合图像与文本的分类
利用文本提示对图像进行分类