D

Dse Qwen2 2b Mrl V1

由 MrLight 开发
DSE-QWen2-2b-MRL-V1 是一个双编码器模型,专为将文档截图编码为密集向量以实现文档检索而设计。
下载量 4,447
发布时间 : 9/11/2024
模型介绍
内容详情
替代品

模型简介

该模型采用文档截图嵌入(DSE)方法,以原始视觉格式捕获文档,保留所有信息(如文本、图像和布局),避免繁琐的解析和潜在的信息丢失。旨在为文本、PDF文档、网页和幻灯片检索提供通用的嵌入模型。

模型特点

原始视觉格式处理
直接处理文档截图,保留原始布局、文本和图像信息
灵活的表示维度
支持调整输出嵌入维度以平衡效果与效率
灵活的输入尺寸
可根据GPU资源调整输入图像尺寸
多语言支持
支持英文和法文文档处理

模型能力

文档截图嵌入
密集向量检索
跨模态文档理解
多语言文档处理

使用案例

文档检索
学术论文检索
通过论文截图检索相关文献
在ViDoRE排行榜上实现85.8的nDCG@5
企业文档管理
快速检索PDF、PPT等企业文档
跨模态搜索
图文混合检索
同时处理文档中的文本和视觉信息进行检索