C

Colqwen2.5 3b Multilingual V1.0

由 tsystems 开发
基于Qwen2.5-VL-3B-Instruct与ColBERT策略的多语言视觉检索模型,支持动态输入图像分辨率和多语言文档检索。
下载量 13.29k
发布时间 : 3/9/2025
模型介绍
内容详情
替代品

模型简介

ColQwen是一种新型视觉语言模型架构,能高效通过视觉特征索引文档,生成ColBERT风格的多向量文本与图像表征,适用于多语言视觉文档检索任务。

模型特点

多语言支持
支持英语、法语、西班牙语、意大利语和德语五种语言的视觉文档检索
动态图像分辨率
支持不改变宽高比的动态输入图像分辨率,最大限制为768个图像块
高效检索架构
采用ColBERT风格的多向量表征策略,提高文档检索效率
多模态嵌入
同时处理文本和图像输入,生成联合的多模态嵌入

模型能力

多语言视觉文档检索
文本到图像检索
多模态嵌入生成
动态分辨率图像处理

使用案例

文档检索
多语言PDF文档检索
根据文本查询在多语言PDF文档库中检索相关文档
可高效检索包含视觉内容的文档
视觉问答系统
基于文档图像内容回答用户问题
结合文本和视觉信息提供准确答案