N

Nomic Embed Vision V1

由 nomic-ai 开发
高性能视觉嵌入模型,与nomic-embed-text-v1共享相同的嵌入空间,支持多模态应用
下载量 2,032
发布时间 : 5/13/2024
模型介绍
内容详情
替代品

模型简介

nomic-embed-vision-v1是一款视觉嵌入模型,能够将图像转换为嵌入向量,并与文本嵌入空间对齐,实现多模态检索和分析。

模型特点

多模态支持
与nomic-embed-text-v1共享相同的嵌入空间,支持文本和图像的联合检索和分析。
高性能
在Imagenet零样本、Datacomp和MTEB等基准测试中表现优异,超越OpenAI CLIP和Jina CLIP等模型。
易于集成
提供简单的API和Python客户端,便于快速生成图像嵌入向量。

模型能力

图像特征提取
多模态检索
文本到图像检索
图像分类

使用案例

信息检索
多模态RAG
在检索增强生成(RAG)场景中,结合文本和图像进行多模态检索。
提升检索准确性和相关性。
数据可视化
CC3M数据集可视化
使用Nomic Atlas地图可视化10万样本的CC3M数据集,比较视觉与文本嵌入空间。
直观展示多模态数据的分布和关系。