E

E5 Large En Ru

由 d0rj 开发
这是intfloat/multilingual-e5-large模型的词汇表剪枝版本,仅保留俄语和英语词元,保持了原版模型的性能表现。
下载量 712
发布时间 : 9/18/2023
模型介绍
内容详情
替代品

模型简介

E5-large-en-ru是一个多语言文本嵌入模型,专门针对俄语和英语进行了优化,适用于信息检索、语义相似度计算等任务。

模型特点

词汇表优化
通过剪枝仅保留俄语和英语词元,显著减小模型体积同时保持性能
高性能检索
在SberQuAD基准测试中表现优异,各项指标与原版模型相当
多任务适配
支持通过前缀区分不同任务类型(查询/段落/对称任务)

模型能力

文本向量化
语义相似度计算
信息检索
跨语言文本匹配

使用案例

信息检索
开放域问答
用于检索与问题最相关的文档段落
在SberQuAD测试中recall@5达到82.8%
语义分析
文档相似度计算
比较不同文档之间的语义相似度