C

Colqwen2.5 3b Multilingual

由 Metric-AI 开发
基于Qwen2.5-VL-3B-Instruct的多语言视觉检索器,采用ColBERT策略,在Vidore基准测试中表现优异
下载量 1,957
发布时间 : 2/1/2025
模型介绍
内容详情
替代品

模型简介

ColQwen是一种基于视觉语言模型(VLM)的新型架构和训练策略的模型,能高效地从视觉特征索引文档。支持多语言和多模态嵌入,适用于文本到视觉文档检索任务。

模型特点

多语言支持
支持英语、法语、西班牙语、意大利语和德语等多种语言的视觉文档检索
动态输入分辨率
支持动态输入图像分辨率且不改变原始宽高比,最大分辨率限制为最多生成768个图像块
高效检索
采用ColBERT策略,生成多向量文本和图像表示,提高检索效率
高性能
在Vidore基准测试中,7B参数以下模型中排名第一,整体排名第三

模型能力

多模态嵌入
多语言嵌入
文本到视觉文档检索
高效文档索引

使用案例

文档检索
多语言文档检索
从多语言文档中检索相关内容
高效准确地检索多语言文档
视觉文档检索
从视觉文档中检索相关内容
支持动态输入分辨率,提高检索效率