N

Nllb Clip Large Siglip

由 visheratin 开发
NLLB-CLIP-SigLIP是一个结合了NLLB模型的文本编码器和SigLIP模型的图像编码器的多语言视觉语言模型,支持201种语言。
下载量 384
发布时间 : 11/14/2023

模型简介

该模型结合了NLLB的文本编码能力和SigLIP的图像编码能力,特别擅长低资源语言的跨模态任务,在Crossmodal-3600数据集上表现优异。

模型特点

多语言支持
支持Flores-200的201种语言,包括许多低资源语言
跨模态能力
结合文本和图像编码能力,擅长图像-文本匹配任务
低资源语言表现
在低资源语言上达到最先进水平

模型能力

多语言图像分类
跨语言图像检索
零样本学习

使用案例

多语言内容理解
多语言图像分类
使用不同语言的文本标签对图像进行分类
在Crossmodal-3600数据集上表现优异
跨语言图像检索
使用不同语言查询检索相关图像
支持201种语言的查询
AIbase
智启未来,您的人工智能解决方案智库
简体中文