C

Colqwen2.5 V0.2

由 vidore 开发
ColQwen2.5是基于Qwen2.5-VL-3B-Instruct与ColBERT策略的视觉检索模型,专注于通过视觉特征高效索引文档。
下载量 22.31k
发布时间 : 1/31/2025
模型介绍
内容详情
替代品

模型简介

ColQwen2.5是一种视觉语言模型(VLM),能够生成文本和图像的ColBERT风格多向量表示,用于高效文档检索。

模型特点

动态输入图像分辨率
支持动态输入图像分辨率且不进行尺寸调整,保持相同宽高比处理。
多向量表示
生成文本和图像的ColBERT风格多向量表示,提升检索效率。
高分辨率处理
最大分辨率设定为最多生成768个图像块,增加图像块数量可显著提升效果。

模型能力

视觉文档检索
多向量表示生成
动态图像处理

使用案例

文档检索
学术文档检索
用于检索学术论文中的相关内容。
PDF文档检索
用于检索PDF文档中的视觉和文本信息。