C

Colqwen2.5 3b Multilingual V1.0 Merged

由 tsystems 开发
基于Qwen2.5-VL-3B-Instruct与ColBERT策略的多语言视觉检索模型,支持动态输入图像分辨率,生成ColBERT风格的多向量文本与图像表征。
下载量 70
发布时间 : 3/9/2025
模型介绍
内容详情
替代品

模型简介

该模型是一种基于视觉语言模型(VLMs)的新型架构与训练策略的模型,能高效通过视觉特征索引文档,支持多语言和多模态嵌入。

模型特点

多语言支持
支持英语、法语、西班牙语、意大利语和德语等多种语言的视觉文档检索
动态图像分辨率
支持动态输入图像分辨率且不改变宽高比,最大分辨率设定为最多生成768个图像块
高效检索
采用ColBERT风格的多向量表征,实现高效的文档检索
多模态嵌入
支持文本和图像的联合嵌入,实现跨模态检索

模型能力

多语言视觉文档检索
文本到图像检索
多模态嵌入
动态图像处理

使用案例

文档检索
多语言PDF文档检索
在多语言PDF文档中根据文本查询检索相关图像或文档片段
高效检索相关文档内容,支持多种语言
视觉问答系统
在视觉问答系统中根据问题检索相关图像或文档内容
提升问答系统的准确性和效率
跨模态检索
文本到图像检索
根据文本描述检索相关图像
实现高效的跨模态检索