C

Colpali V1.3 Hf

由 vidore 开发
ColPali是一种基于PaliGemma-3B扩展的视觉语言模型,能高效通过视觉特征索引文档,生成ColBERT式多向量表示。
下载量 790
发布时间 : 11/28/2024
模型介绍
内容详情
替代品

模型简介

该模型通过视觉特征索引文档,结合PaliGemma-3B的视觉语言能力和ColBERT的多向量表示策略,实现高效的文档检索。

模型特点

多向量表示
采用ColBERT策略生成文本与图像的多向量表示,提高检索精度
视觉语言融合
结合PaliGemma-3B的视觉语言能力,实现跨模态理解
高效检索
通过视觉特征索引文档,优化检索效率

模型能力

视觉文档检索
跨模态理解
多向量表示生成

使用案例

文档检索
PDF文档检索
通过视觉特征快速检索PDF文档中的相关内容
跨模态搜索
图文关联搜索
根据文本查询检索相关图像内容,或根据图像检索相关文本