S

Snowflake Arctic Embed L V2.0 Gguf

由 Casual-Autopsy 开发
Snowflake Arctic-embed-l-v2.0 是 Snowflake 发布的最新嵌入模型,专为多语言工作负载设计,优化了检索性能和推理效率。
下载量 4,066
发布时间 : 2/6/2025
模型介绍
内容详情
替代品

模型简介

Arctic Embed 2.0 为多语言嵌入模型设立了新标准,在不牺牲英语性能的前提下,实现了高质量的多语言文本检索。

模型特点

无妥协的多语言支持
在英语和非英语检索中表现出色,在 MTEB Retrieval、CLEF 和 MIRACL 等基准测试中优于领先的开源和专有模型。
推理效率
其 303m 非嵌入参数推理速度快,适用于任何规模的效率需求。
压缩友好
通过 Matryoshka 表示学习(MRL)和量化感知嵌入训练,实现高质量检索,嵌入向量小至 128 字节/向量。
直接替换
基于 BAAI/bge-m3-retromae,可直接替换任何形式的新库、内核、推理引擎等。
长上下文支持
通过 RoPE 支持高达 8192 的上下文窗口。

模型能力

多语言文本检索
句子相似度计算
高效推理
高质量嵌入

使用案例

信息检索
企业级多语言搜索
适用于需要大规模可靠、企业级多语言搜索和检索的应用。
在 MTEB Retrieval、CLEF 和 MIRACL 等基准测试中表现优异。
自然语言处理
多语言文本相似度计算
用于计算不同语言文本之间的相似度。
支持多种语言的文本相似度计算。