N

Nllb Siglip Mrl Large

由 visheratin 开发
NLLB-SigLIP-MRL 是一个结合了NLLB模型的文本编码器和SigLIP模型的图像编码器的多语言视觉-语言模型,支持Flores-200的201种语言。
下载量 297
发布时间 : 3/4/2024
模型介绍
内容详情
替代品

模型简介

该模型结合了NLLB的文本编码能力和SigLIP的图像编码能力,通过Matryoshka表示学习训练,支持多种嵌入尺寸,在多语言图像和文本检索任务上达到最先进水平。

模型特点

多语言支持
支持Flores-200的201种语言,扩展了模型的多语言能力。
可变嵌入尺寸
支持[32, 64, 128, 256, 512]等多种嵌入尺寸,256和512尺寸保留了90%以上的完整嵌入质量。
最先进性能
在XTD10和Crossmodal-3600数据集上为多语言图像和文本检索设定了新的最先进水平。

模型能力

多语言图像分类
多语言文本检索
多语言图像检索
零样本学习

使用案例

多语言内容检索
跨语言图像搜索
使用不同语言的文本查询检索相关图像
在Crossmodal-3600数据集上图像检索R@1达到0.6079
多语言图像分类
使用不同语言的标签对图像进行分类