C

Colsmolvlm V0.1

由 vidore 开发
基于SmolVLM-Instruct与ColBERT策略的视觉检索模型,能高效通过视觉特征索引文档
下载量 1,353
发布时间 : 11/27/2024
模型介绍
内容详情
替代品

模型简介

ColSmolVLM是一种基于视觉语言模型(VLM)的新型架构与训练策略的模型,能生成文本和图像的ColBERT风格多向量表示,用于高效文档检索

模型特点

ColBERT风格多向量表示
能生成文本和图像的多向量表示,提高检索效率
视觉文档检索
专门针对PDF类文档优化的检索能力
LoRA适配器
使用低秩适配器(LoRA)进行高效训练

模型能力

视觉文档检索
多模态表示学习
跨模态匹配

使用案例

文档检索
学术文献检索
通过视觉特征检索学术PDF文档
企业文档管理
高效索引和管理大量PDF文档