C

Colnomic Embed Multimodal 7b

由 nomic-ai 开发
ColNomic Embed Multimodal 7B是一款多向量最先进的多模态嵌入模型,擅长视觉文档检索任务,支持多语言和统一文本图像编码。
下载量 7,909
发布时间 : 3/31/2025
模型介绍
内容详情
替代品

模型简介

该模型是一款70亿参数的多模态嵌入模型,专为视觉文档检索任务设计,能够直接编码交错排列的文本和图像,无需复杂预处理。

模型特点

高性能
在Vidore-v2上达到62.7 NDCG@5,超越所有其他模型
统一文本图像编码
直接编码交错排列的文本和图像,无需复杂预处理
先进架构
70亿参数的多模态嵌入模型
完全开源
提供模型权重、训练数据和代码
多语言支持
支持英语、意大利语、法语、德语和西班牙语

模型能力

视觉文档检索
多模态嵌入
多语言嵌入
文本到视觉文档检索

使用案例

研究论文
捕获公式、图表和表格
用于检索包含复杂科学公式和图表的学术论文
提高检索准确率
技术文档
编码代码块、流程图和截图
用于检索技术文档中的代码示例和系统架构图
更精准的技术内容检索
产品目录
产品图像检索
根据产品描述检索相关产品图像
提升电子商务体验
财务报告
嵌入图表、图形和数值数据
用于检索财务报告中的关键数据可视化
快速定位关键财务指标