gguf-jina-reranker-v1-tiny-en开源模型 - 极速重排序，支持长文本处理

首页

Gguf Jina Reranker V1 Tiny En

由 Felladrin 开发

专为极速重排序设计的模型，基于JinaBERT架构，支持长文本序列处理（最高8,192令牌）。

文本嵌入英语开源协议:Apache-2.0 #极速重排序 #长文本处理 #知识蒸馏

下载量 3,831

发布时间 : 1/25/2025

模型简介

该模型通过知识蒸馏技术实现快速重排序，在保持竞争力的性能下优先考虑速度，适合对绝对准确性要求不高的场景。

模型特点

极速重排序

通过4层架构和33.0百万参数设计，实现最快的推理速度。

长文本处理

支持最高8,192个令牌的序列长度，优于传统重排序模型。

知识蒸馏技术

从更复杂的教师模型(jina-reranker-v1-base-en)中提取知识，保持竞争力性能。

模型能力

文本重排序

长文本序列处理

快速推理

使用案例

信息检索

搜索结果重排序

对搜索引擎返回的结果进行相关性重排序

提高前3位结果的命中率达85%

推荐系统

推荐内容排序

根据用户查询对推荐内容进行相关性排序

🚀 jina-reranker-v1-tiny-en-GGUF

jina-reranker-v1-tiny-en-GGUF 模型专为实现极快的重排序速度而设计，同时保持了具有竞争力的性能。它基于 JinaBERT 模型，能够处理长达 8192 个标记的文本序列，在文本重排序任务中表现出色。

🚀 快速开始

使用 Jina AI 的 Reranker API

使用 Jina AI 的 Reranker API 是开始使用 jina-reranker-v1-tiny-en 的最简单方法。

curl https://api.jina.ai/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
  "model": "jina-reranker-v1-tiny-en",
  "query": "Organic skincare products for sensitive skin",
  "documents": [
    "Eco-friendly kitchenware for modern homes",
    "Biodegradable cleaning supplies for eco-conscious consumers",
    "Organic cotton baby clothes for sensitive skin",
    "Natural organic skincare range for sensitive skin",
    "Tech gadgets for smart homes: 2024 edition",
    "Sustainable gardening tools and compost solutions",
    "Sensitive skin-friendly facial cleansers and toners",
    "Organic food wraps and storage solutions",
    "All-natural pet food for dogs with allergies",
    "Yoga mats made from recycled materials"
  ],
  "top_n": 3
}'

使用 `sentence-transformers` 库

你可以使用最新版本的 sentence-transformers>=0.27.0 库与模型进行交互。首先，通过以下命令安装该库：

pip install -U sentence-transformers

然后，使用以下代码与模型进行交互：

from sentence_transformers import CrossEncoder

# Load the model, here we use our tiny sized model
model = CrossEncoder("jinaai/jina-reranker-v1-tiny-en", trust_remote_code=True)

# Example query and documents
query = "Organic skincare products for sensitive skin"
documents = [
    "Eco-friendly kitchenware for modern homes",
    "Biodegradable cleaning supplies for eco-conscious consumers",
    "Organic cotton baby clothes for sensitive skin",
    "Natural organic skincare range for sensitive skin",
    "Tech gadgets for smart homes: 2024 edition",
    "Sustainable gardening tools and compost solutions",
    "Sensitive skin-friendly facial cleansers and toners",
    "Organic food wraps and storage solutions",
    "All-natural pet food for dogs with allergies",
    "Yoga mats made from recycled materials"
]

results = model.rank(query, documents, return_documents=True, top_k=3)

使用 `transformers` 库

你还可以使用 transformers 库以编程方式与模型进行交互。

!pip install transformers
from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained(
    'jinaai/jina-reranker-v1-tiny-en', num_labels=1, trust_remote_code=True
)

# Example query and documents
query = "Organic skincare products for sensitive skin"
documents = [
    "Eco-friendly kitchenware for modern homes",
    "Biodegradable cleaning supplies for eco-conscious consumers",
    "Organic cotton baby clothes for sensitive skin",
    "Natural organic skincare range for sensitive skin",
    "Tech gadgets for smart homes: 2024 edition",
    "Sustainable gardening tools and compost solutions",
    "Sensitive skin-friendly facial cleansers and toners",
    "Organic food wraps and storage solutions",
    "All-natural pet food for dogs with allergies",
    "Yoga mats made from recycled materials"
]

# construct sentence pairs
sentence_pairs = [[query, doc] for doc in documents]

scores = model.compute_score(sentence_pairs)

使用 `transformers.js` 库

你可以使用 transformers.js 库直接在 JavaScript（浏览器、Node.js、Deno 等）中运行模型。首先，通过以下命令安装该库：

npm i @xenova/transformers

然后，使用以下代码与模型进行交互：

import { AutoTokenizer, AutoModelForSequenceClassification } from '@xenova/transformers';

const model_id = 'jinaai/jina-reranker-v1-tiny-en';
const model = await AutoModelForSequenceClassification.from_pretrained(model_id, { quantized: false });
const tokenizer = await AutoTokenizer.from_pretrained(model_id);

/**
 * Performs ranking with the CrossEncoder on the given query and documents. Returns a sorted list with the document indices and scores.
 * @param {string} query A single query
 * @param {string[]} documents A list of documents
 * @param {Object} options Options for ranking
 * @param {number} [options.top_k=undefined] Return the top-k documents. If undefined, all documents are returned.
 * @param {number} [options.return_documents=false] If true, also returns the documents. If false, only returns the indices and scores.
 */
async function rank(query, documents, {
    top_k = undefined,
    return_documents = false,
} = {}) {
    const inputs = tokenizer(
        new Array(documents.length).fill(query),
        { text_pair: documents, padding: true, truncation: true }
    )
    const { logits } = await model(inputs);
    return logits.sigmoid().tolist()
        .map(([score], i) => ({
            corpus_id: i,
            score,
            ...(return_documents ? { text: documents[i] } : {})
        })).sort((a, b) => b.score - a.score).slice(0, top_k);
}

// Example usage:
const query = "Organic skincare products for sensitive skin"
const documents = [
    "Eco-friendly kitchenware for modern homes",
    "Biodegradable cleaning supplies for eco-conscious consumers",
    "Organic cotton baby clothes for sensitive skin",
    "Natural organic skincare range for sensitive skin",
    "Tech gadgets for smart homes: 2024 edition",
    "Sustainable gardening tools and compost solutions",
    "Sensitive skin-friendly facial cleansers and toners",
    "Organic food wraps and storage solutions",
    "All-natural pet food for dogs with allergies",
    "Yoga mats made from recycled materials",
]

const results = await rank(query, documents, { return_documents: true, top_k: 3 });
console.log(results);

✨ 主要特性

极快的重排序速度：通过知识蒸馏技术，该模型在保持较高准确率的同时，实现了极快的推理速度。
长序列处理能力：基于 JinaBERT 模型，支持对称双向的 ALiBi，能够处理长达 8192 个标记的文本序列。
多种使用方式：支持通过 Jina AI 的 Reranker API、sentence-transformers 库、transformers 库和 transformers.js 库与模型进行交互。

📦 安装指南

安装 `sentence-transformers` 库

pip install -U sentence-transformers

安装 `transformers` 库

pip install transformers

安装 `transformers.js` 库

npm i @xenova/transformers

📚 详细文档

模型信息

属性	详情
模型创建者	Jina AI
原始模型	jina-reranker-v1-tiny-en
GGUF 量化	基于 llama.cpp 版本 f4d2b

重排序模型对比

模型名称	层数	隐藏层大小	参数数量（百万）
jina-reranker-v1-base-en	12	768	137.0
jina-reranker-v1-turbo-en	6	384	37.8
jina-reranker-v1-tiny-en	4	384	33.0

评估结果

为确保顶级性能和搜索相关性，我们在 3 个关键基准测试中对 Jina Reranker 进行了评估。

模型名称	NDCG@10 (17 BEIR 数据集)	NDCG@10 (5 LoCo 数据集)	命中率 (LlamaIndex RAG)
`jina-reranker-v1-base-en`	52.45	87.31	85.53
`jina-reranker-v1-turbo-en`	49.60	69.21	85.13
`jina-reranker-v1-tiny-en` (当前模型)	48.54	70.29	85.00
`mxbai-rerank-base-v1`	49.19	-	82.50
`mxbai-rerank-xsmall-v1`	48.80	-	83.69
`ms-marco-MiniLM-L-6-v2`	48.64	-	82.63
`ms-marco-MiniLM-L-4-v2`	47.81	-	83.82
`bge-reranker-base`	47.89	-	83.03