rank_zephyr_7b_v1_full-GGUF开源模型 - 免费用于高效文本排序任务

首页

Rank Zephyr 7b V1 Full GGUF

由 tensorblock 开发

这是castorini/rank_zephyr_7b_v1_full模型的GGUF量化版本，适用于文本排序任务。

大型语言模型英语开源协议:MIT #文本排序 #轻量化推理 #多级量化

下载量 66

发布时间 : 11/16/2024

模型简介

该模型是Zephyr 7B的量化版本，专门用于文本排序任务，提供了多种量化选项以适应不同硬件需求。

模型特点

多种量化选项

提供从Q2_K到Q8_0共12种量化级别，满足不同硬件条件下的使用需求

高效推理

经过优化的GGUF格式，在保持模型性能的同时提高推理效率

兼容性强

与llama.cpp兼容，可在多种设备上运行

模型能力

文本排序

文本理解

上下文推理

使用案例

信息检索

搜索结果排序

对搜索引擎返回的结果进行相关性排序

提高搜索结果的相关性和用户体验

推荐系统

推荐内容排序

对推荐系统生成的内容列表进行优化排序

提高推荐内容的点击率和用户满意度

🚀 castorini/rank_zephyr_7b_v1_full - GGUF

本仓库包含 castorini/rank_zephyr_7b_v1_full 的 GGUF 格式模型文件。这些文件由 TensorBlock 提供的机器进行量化，并且与截至提交 b4011 的 llama.cpp 兼容。

反馈与支持：可通过 TensorBlock 的 Twitter/X、Telegram 群组和 Discord 服务器获取。

✨ 主要特性

项目相关

本项目除了当前的模型文件仓库，还有以下相关项目：

项目名称	项目详情	项目图片	项目链接
Awesome MCP Servers	一个全面的模型上下文协议（MCP）服务器集合。		👀 查看项目 👀
TensorBlock Studio	一个轻量级、开放且可扩展的多大语言模型交互工作室。		👀 查看项目 👀

模型信息

属性	详情
模型类型	基于 castorini/rank_zephyr_7b_v1_full 的 GGUF 格式模型
量化提供方	TensorBlock
兼容版本	截至提交 b4011 的 llama.cpp

📚 详细文档

提示模板

<|system|>
{system_prompt}</s>
<|user|>
{prompt}</s>
<|assistant|>

模型文件规格

文件名	量化类型	文件大小	描述
rank_zephyr_7b_v1_full-Q2_K.gguf	Q2_K	2.532 GB	最小，但有显著质量损失，不建议用于大多数场景
rank_zephyr_7b_v1_full-Q3_K_S.gguf	Q3_K_S	2.947 GB	非常小，但有较高质量损失
rank_zephyr_7b_v1_full-Q3_K_M.gguf	Q3_K_M	3.277 GB	非常小，但有较高质量损失
rank_zephyr_7b_v1_full-Q3_K_L.gguf	Q3_K_L	3.560 GB	小，但有实质性质量损失
rank_zephyr_7b_v1_full-Q4_0.gguf	Q4_0	3.827 GB	旧版；小，但有非常高的质量损失，建议使用 Q3_K_M
rank_zephyr_7b_v1_full-Q4_K_S.gguf	Q4_K_S	3.856 GB	小，但有较大质量损失
rank_zephyr_7b_v1_full-Q4_K_M.gguf	Q4_K_M	4.068 GB	中等，质量平衡，推荐使用
rank_zephyr_7b_v1_full-Q5_0.gguf	Q5_0	4.654 GB	旧版；中等，质量平衡，建议使用 Q4_K_M
rank_zephyr_7b_v1_full-Q5_K_S.gguf	Q5_K_S	4.654 GB	大，质量损失低，推荐使用
rank_zephyr_7b_v1_full-Q5_K_M.gguf	Q5_K_M	4.779 GB	大，质量损失非常低，推荐使用
rank_zephyr_7b_v1_full-Q6_K.gguf	Q6_K	5.534 GB	非常大，质量损失极低
rank_zephyr_7b_v1_full-Q8_0.gguf	Q8_0	7.167 GB	非常大，质量损失极低，不建议使用

📦 安装指南

命令行方式

安装 Huggingface 客户端

pip install -U "huggingface_hub[cli]"

下载单个模型文件到本地目录

huggingface-cli download tensorblock/rank_zephyr_7b_v1_full-GGUF --include "rank_zephyr_7b_v1_full-Q2_K.gguf" --local-dir MY_LOCAL_DIR

按模式下载多个模型文件

如果你想按模式（例如 *Q4_K*gguf）下载多个模型文件，可以尝试以下命令：

huggingface-cli download tensorblock/rank_zephyr_7b_v1_full-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

📄 许可证

本项目采用 MIT 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文