M

Multilingual E5 Large Pooled Q8 0 GGUF

由 falan42 开发
多语言E5大型池化模型,支持多种语言的句子相似度计算和特征提取任务。
下载量 56
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

这是一个多语言的句子嵌入模型,基于E5架构,能够处理多种语言的文本并生成高质量的句子嵌入表示。

模型特点

多语言支持
支持超过100种语言的文本处理,包括主流语言和部分小众语言
高性能句子嵌入
在多种语言的句子相似度任务上表现出色,能够生成高质量的句子向量表示
MTEB基准测试验证
在MTEB(Massive Text Embedding Benchmark)多个任务上进行了广泛评估,性能可靠

模型能力

多语言文本嵌入
句子相似度计算
文本特征提取
跨语言信息检索

使用案例

信息检索
跨语言文档检索
使用统一的嵌入空间检索不同语言的相似文档
在MTEB BUCC跨语言bitext mining任务上达到97-99%的准确率
文本分类
多语言情感分析
对多种语言的文本进行情感倾向分类
在MTEB EmotionClassification任务上达到46.5%准确率
产品评论分类
对亚马逊多语言评论进行分类
在MTEB AmazonReviewsClassification任务上英语达到47.56%准确率
问答系统
事实检索问答
从知识库中检索与问题相关的文档
在MTEB HotpotQA任务上达到84.32%的MRR@10