J

Japanese Clip Vit B 16

由 rinna 开发
由rinna株式会社训练的日语CLIP模型,支持日语文本与图像的对比学习
下载量 26.12k
发布时间 : 4/27/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于CLIP架构的多模态模型,能够将日语文本与图像映射到同一特征空间,实现跨模态检索和分类任务。

模型特点

日语专用
专门针对日语优化的CLIP模型,支持日语文本与图像的关联学习
多模态能力
能够同时处理图像和文本输入,实现跨模态的特征提取和匹配
预训练模型
基于大规模数据集(CC12M)预训练,可直接用于下游任务

模型能力

图像特征提取
日语文本特征提取
图像-文本相似度计算
跨模态检索

使用案例

图像分类
多标签图像分类
使用日语标签对图像进行分类
可输出各标签的概率分布
跨模态搜索
以文搜图
使用日语文本描述搜索相关图像
以图搜文
使用图像搜索匹配的日语文本描述