G

Granite Vision 3.3 2b Embedding

由 ibm-granite 开发
基于granite-vision-3.3-2b构建的高效嵌入模型,专为多模态文档检索设计,可处理包含表格、图表、信息图和复杂布局的文档。
下载量 205
发布时间 : 6/3/2025

模型简介

该模型生成ColBERT风格的多向量页面表示,无需基于OCR的文本提取,可简化和加速RAG管道。

模型特点

多模态文档处理
能够处理包含表格、图表、信息图和复杂布局的文档
ColBERT风格表示
生成页面的ColBERT风格多向量表示,提高检索效率
无OCR需求
无需基于OCR的文本提取,简化RAG管道
高效检索
专为加速多模态文档检索而优化

模型能力

多模态文档嵌入
图像-文本相似度计算
复杂布局文档处理
跨模态检索

使用案例

文档检索
财务报告检索
从包含表格和图表的财务报告中检索相关信息
在FinReport数据集上NDCG@5达到70
技术文档检索
从技术报告和幻灯片中检索特定信息
在TechReport和TechSlides数据集上NDCG@5分别达到84和93
跨模态搜索
图像-文本匹配
计算图像与文本描述的相似度
AIbase
智启未来,您的人工智能解决方案智库
简体中文