C

Colsmol 256M

由 vidore 开发
基于SmolVLM-Instruct-250M并采用ColBERT策略的视觉检索器,能高效地从视觉特征索引文档
下载量 42.84k
发布时间 : 1/22/2025
模型介绍
内容详情
替代品

模型简介

ColSmolVLM是一种基于新型模型架构和训练策略的视觉语言模型(VLM),能生成文本和图像的ColBERT风格多向量表示,用于高效文档检索

模型特点

ColBERT风格多向量表示
能生成文本和图像的多向量表示,提高检索效率
高效视觉文档检索
专门优化用于从视觉特征索引文档的任务
LoRA适配器训练
使用低秩适配器(LoRA)进行训练,参数效率高

模型能力

视觉文档检索
多模态表示学习
跨模态匹配

使用案例

文档检索
学术文献检索
从大量PDF文档中检索相关学术文献
企业文档管理
帮助企业管理内部文档库,快速找到所需信息