C

Clip Fa Vision

由 SajjadAyoubi 开发
CLIPfa是OpenAI CLIP模型的波斯语版本,通过对比学习连接波斯语文本与图像表示
下载量 43
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于对比学习的多模态模型,可将波斯语文本与图像映射到共享的向量空间,实现跨模态检索与匹配

模型特点

波斯语适配
使用Farahani的RoBERTa-fa作为文本编码器,专门优化波斯语文本理解
轻量级训练
仅用40万组数据(原版1/10)完成有效训练
双模态对齐
视觉与文本编码器输出768维共享向量空间

模型能力

波斯语图文匹配
跨模态向量检索
图像语义搜索
文本引导图像分类

使用案例

多媒体检索
波斯语图像搜索
用波斯语描述搜索相关图像
在2.5万图库中展示检索效果
内容审核
多语言违规内容识别
通过波斯语文本描述检测违规图像