multilingual-e5-large-instruct-Q8_0-GGUF开源多语言模型 - 支持文本嵌入和分类，跨语言能力强

首页

Multilingual E5 Large Instruct Q8 0 GGUF

由 Gomez12 开发

多语言E5大型指令模型，支持多种语言的文本嵌入和分类任务，具有强大的跨语言能力。

大型语言模型支持多种语言开源协议:MIT #多语言嵌入 #指令微调 #跨语言检索

下载量 90

发布时间 : 4/13/2025

模型简介

该模型是基于E5架构的多语言文本嵌入模型，专门针对指令任务进行了优化。它支持超过100种语言，适用于文本分类、信息检索和语义相似度计算等任务。

模型特点

多语言支持

支持超过100种语言，具有强大的跨语言处理能力。

指令优化

专门针对指令任务进行了优化，适合需要遵循特定指令的应用场景。

高性能文本嵌入

在各种文本嵌入任务中表现出色，特别是在语义相似度计算和信息检索方面。

模型能力

文本分类

信息检索

语义相似度计算

跨语言文本处理

使用案例

电子商务

产品评论分类

对多语言产品评论进行情感分析和分类

在MTEB AmazonCounterfactualClassification任务中达到76.24%的准确率（英语）

信息检索

跨语言文档检索

在不同语言的文档中检索相关信息

在MTEB ArguAna检索任务中达到49.88的map@100

🚀 multilingual-e5-large-instruct-Q8_0-GGUF

本模型是通过 llama.cpp 借助 ggml.ai 的 GGUF-my-repo 空间，从 intfloat/multilingual-e5-large-instruct 转换为 GGUF 格式的。有关该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

✨ 主要特性

支持多语言，涵盖了如英语、德语、中文等众多语言。
经过转换为 GGUF 格式，可与 llama.cpp 兼容使用。

📦 安装指南

通过 brew（适用于 Mac 和 Linux）安装 llama.cpp：

brew install llama.cpp

💻 使用示例

基础用法

使用 llama.cpp 的 CLI 进行推理：

llama-cli --hf-repo Gomez12/multilingual-e5-large-instruct-Q8_0-GGUF --hf-file multilingual-e5-large-instruct-q8_0.gguf -p "The meaning to life and the universe is"

使用 llama.cpp 的服务器进行推理：

llama-server --hf-repo Gomez12/multilingual-e5-large-instruct-Q8_0-GGUF --hf-file multilingual-e5-large-instruct-q8_0.gguf -c 2048

高级用法

如果你想手动克隆 llama.cpp 并进行构建和推理，可以按照以下步骤操作：步骤 1：从 GitHub 克隆 llama.cpp：

git clone https://github.com/ggerganov/llama.cpp

步骤 2：进入 llama.cpp 文件夹，并使用 LLAMA_CURL=1 标志以及其他特定于硬件的标志（例如，在 Linux 上使用 Nvidia GPU 时使用 LLAMA_CUDA=1）进行构建：

cd llama.cpp && LLAMA_CURL=1 make

步骤 3：通过主二进制文件运行推理：

./llama-cli --hf-repo Gomez12/multilingual-e5-large-instruct-Q8_0-GGUF --hf-file multilingual-e5-large-instruct-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo Gomez12/multilingual-e5-large-instruct-Q8_0-GGUF --hf-file multilingual-e5-large-instruct-q8_0.gguf -c 2048

📚 详细文档

你也可以直接通过 Llama.cpp 仓库中列出的使用步骤使用此检查点。

🔧 技术细节

该模型基于 intfloat/multilingual-e5-large-instruct 进行转换，支持多语言处理。在转换为 GGUF 格式后，可以与 llama.cpp 进行集成，从而在不同的硬件环境中运行推理。

📄 许可证

该模型遵循 MIT 许可证。

信息表格

属性	详情
模型类型	多语言指令模型
训练数据	未提及

常用提示信息

⚠️ 重要提示

请确保在使用前安装了必要的依赖项，并且根据你的硬件环境选择合适的构建标志。

💡 使用建议

在使用 llama.cpp 时，可以根据需要调整 -c 参数来设置上下文长度，以获得更好的推理效果。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文