C

Colpali V1.2 Hf

由 vidore 开发
ColPali是基于PaliGemma-3B与ColBERT策略的视觉检索模型,用于通过视觉特征高效索引文档
下载量 5,075
发布时间 : 11/28/2024
模型介绍
内容详情
替代品

模型简介

ColPali是一种创新的视觉语言模型,通过扩展PaliGemma-3B并采用ColBERT风格的多向量表示策略,能够高效生成文本与图像的联合表示,用于文档检索任务。

模型特点

多向量表示
采用ColBERT策略生成文本标记与图像块间的交互表示
高效检索
通过视觉特征索引文档,实现高效的文档检索
视觉语言联合建模
结合视觉编码器(SigLIP)和语言模型(PaliGemma-3B)的优势
LoRA微调
使用低秩适配器(LoRA)进行高效微调,减少训练成本

模型能力

视觉文档检索
多模态表示学习
跨模态匹配
文档内容理解

使用案例

文档管理
企业文档检索
根据查询快速定位公司内部文档中的相关内容
学术文献搜索
通过视觉特征检索学术论文中的相关信息
知识管理
知识库构建
为组织构建可检索的知识库系统