C

Colpali V1.1

由 vidore 开发
ColPali是基于PaliGemma-3B与ColBERT策略的视觉检索模型,用于高效地从视觉特征中索引文档。
下载量 196
发布时间 : 8/21/2024
模型介绍
内容详情
替代品

模型简介

ColPali是一种视觉语言模型(VLM),能够生成文本和图像的ColBERT风格多向量表示,主要用于文档检索任务。

模型特点

多向量表示
生成文本和图像的ColBERT风格多向量表示,提高检索效率。
视觉语言融合
结合SigLIP和PaliGemma-3B的优势,实现视觉与语言特征的深度融合。
高效检索
通过ColBERT策略计算文本标记与图像块之间的交互,显著提升检索性能。

模型能力

视觉文档检索
多模态表示学习
文档索引

使用案例

文档检索
学术文档检索
从大量PDF文档中快速检索相关信息。
在ViDoRe基准测试中表现优异
企业文档管理
高效管理和检索企业内部文档。