C

Colqwen2 7b V1.0

由 tsystems 开发
基于Qwen2-VL-7B-Instruct并采用ColBERT策略的视觉检索模型,专注于高效视觉特征索引文档
下载量 172
发布时间 : 12/30/2024
模型介绍
内容详情
替代品

模型简介

ColQwen是基于视觉语言模型的新型架构,能生成ColBERT风格的多向量文本和图像表示,用于高效文档检索

模型特点

动态图像分辨率处理
接受动态分辨率输入且不调整大小,保持原始宽高比,最多生成768个图像块
多向量表示
采用ColBERT风格的多向量文本和图像表示,提升检索效率
LoRA微调
使用低秩适配器(LoRA)进行高效微调,在语言模型Transformer层和投影层设置alpha=64和r=64

模型能力

视觉文档检索
多模态嵌入
跨模态匹配

使用案例

文档检索
PDF文档检索
从大量PDF文档中快速检索相关内容
实验表明增加图像块数量能显著提升效果