C

Colqwen2 V1.0

由 vidore 开发
ColQwen2是基于Qwen2-VL-2B-Instruct与ColBERT策略的视觉检索模型,用于高效索引文档的视觉特征。
下载量 106.85k
发布时间 : 11/3/2024
模型介绍
内容详情
替代品

模型简介

ColQwen2是一种视觉语言模型(VLM),能够生成文本和图像的ColBERT风格多向量表示,主要用于文档检索任务。

模型特点

动态输入图像分辨率
支持不调整尺寸的原始宽高比输入,最大分辨率设定为最多生成768个图像块
多向量表示
采用ColBERT风格的多向量表示方法,提高检索效率
LoRA适配器
在语言模型的Transformer层和投影层应用低秩适配器(LoRA),参数为alpha=32和r=32

模型能力

视觉文档检索
多模态表示学习
跨模态检索

使用案例

文档检索
学术文献检索
从大量PDF文档中检索相关学术文献
显著提升检索效率
企业文档管理
企业内部文档的高效索引和检索
提高文档查找效率