M

Mexma Siglip

由 visheratin 开发
MEXMA-SigLIP 是一个结合了多语言文本编码器和图像编码器的高性能CLIP模型,支持80种语言。
下载量 137
发布时间 : 12/4/2024
模型介绍
内容详情
替代品

模型简介

该模型结合了MEXMA多语言文本编码器和SigLIP图像编码器,能够在80种语言上实现高性能的零样本图像分类。

模型特点

多语言支持
支持80种语言的零样本图像分类
高性能
在Crossmodal-3600数据集上达到商业友好型模型的最先进性能
结合优势模型
结合了MEXMA多语言文本编码器和SigLIP图像编码器的优势

模型能力

零样本图像分类
多语言文本理解
图像-文本匹配

使用案例

多语言图像分类
多语言图像标注
使用不同语言对图像进行分类和标注
可准确识别图像内容并用多种语言描述