C

Colsmol 500M

由 vidore 开发
基于SmolVLM-Instruct-500M与ColBERT策略的视觉检索模型,能高效通过视觉特征索引文档
下载量 1,807
发布时间 : 1/22/2025
模型介绍
内容详情
替代品

模型简介

ColSmolVLM是一种基于视觉语言模型(VLMs)的新型架构和训练策略,能生成文本和图像的ColBERT式多向量表示,用于高效文档检索

模型特点

ColBERT式多向量表示
能生成文本和图像的多向量表示,提高检索效率
高效视觉特征索引
通过视觉特征高效索引文档内容
LoRA适配器训练
在语言模型的Transformer层和投影层应用LoRA适配器进行训练

模型能力

视觉文档检索
多向量表示生成
图像-文本匹配

使用案例

文档检索
学术文献检索
通过视觉特征检索PDF文档中的相关内容
企业文档管理
快速定位公司内部文档中的相关信息