Rank1开源信息检索重排序模型 - 基于Qwen2.5训练，精准提升相关性判断

首页

Rank1 0.5b

由 jhu-clsp 开发

rank1是一款基于Qwen2.5-0.5B训练的信息检索重排序模型，通过生成推理链提升相关性判断准确性。

大型语言模型

Transformers

英语开源协议:MIT #推理链重排序 #测试时计算 #信息检索

下载量 21

发布时间 : 3/11/2025

模型简介

该模型在信息检索中用于重排序任务，通过在做相关性判断前生成显式推理链，将复杂决策分解为逻辑步骤，提升多样化检索任务的性能。

模型特点

测试时计算

在相关性判断前生成推理链，使模型能够'思考'后再做决策

二元判断机制

通过true/false标记的对数概率返回置信度分数，提高判断准确性

多尺寸选择

提供从0.5B到32B不同参数规模的模型变体，适应不同计算需求

模型能力

信息检索重排序

使用案例

信息检索

搜索引擎结果重排序

对初步检索结果进行精细化排序，提升结果相关性

在处理微妙主题时尤其有效

问答系统

评估候选答案与问题的相关性

通过推理链提高判断准确性

🚀 rank1-0.5b：信息检索重排序的测试时计算模型

rank1是一个推理重排序模型，在进行相关性判断之前会进行“思考”。这个具有0.5B参数的模型基于Qwen2.5 - 0.5B基础模型进行训练，并利用测试时计算来生成推理链，然后再判断文档是否与查询相关。

📄 论文 | 🚀 GitHub仓库

🚀 快速开始

rank1是一种推理重排序模型，在进行相关性判断之前会进行“思考”。这个0.5B参数的模型基于Qwen2.5 - 0.5B基础模型进行训练，并利用测试时计算来生成推理链，然后再决定文档是否与查询相关。

✨ 主要特性

rank1在信息检索中引入了一种新颖的方法，即在进行相关性判断之前生成明确的推理链。与直接输出分数的传统重排序器不同，rank1会接收查询和文档对，在<think>...</think>部分生成推理链，做出二元相关性判断（true或false），并根据真假标记的对数几率返回置信度分数。这种方法有助于模型将复杂的相关性决策分解为逻辑步骤，提高了在各种检索任务中的性能。

📦 安装指南

请参考Github上的详细安装说明。

💻 使用示例

基础用法

注意，官方使用方法可在Github上找到，其中考虑了边缘情况。但对于简单用例，以下最小示例即可。

点击展开：使用vLLM的最小示例

from vllm import LLM, SamplingParams
import math

# Initialize the model with vLLM
model = LLM(
    model="jhu-clsp/rank1-0.5b",
    tensor_parallel_size=1,  # Number of GPUs
    trust_remote_code=True,
    max_model_len=16000,     # Context length
    gpu_memory_utilization=0.9,
    dtype="float16",
)

# Set up sampling parameters
sampling_params = SamplingParams(
    temperature=0,
    max_tokens=8192,
    logprobs=20,
    stop=["</think> true", "</think> false"],
    skip_special_tokens=False
)

# Prepare the prompt
def create_prompt(query, document):
    return (
        "Determine if the following passage is relevant to the query. "
        "Answer only with 'true' or 'false'.\n"
        f"Query: {query}\n"
        f"Passage: {document}\n"
        "<think>"
    )

# Example usage
query = "What are the effects of climate change?"
document = "Climate change leads to rising sea levels, extreme weather events, and disruptions to ecosystems. These effects are caused by increasing greenhouse gas concentrations in the atmosphere due to human activities."

# Generate prediction
prompt = create_prompt(query, document)
outputs = model.generate([prompt], sampling_params)

# Extract score
output = outputs[0].outputs[0]
text = output.text
final_logits = output.logprobs[-1]

# Get token IDs for "true" and "false" tokens
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("jhu-clsp/rank1-0.5b")
true_token = tokenizer(" true", add_special_tokens=False).input_ids[0]
false_token = tokenizer(" false", add_special_tokens=False).input_ids[0]

# Calculate relevance score (probability of "true")
true_logit = final_logits[true_token].logprob
false_logit = final_logits[false_token].logprob
true_score = math.exp(true_logit)
false_score = math.exp(false_logit)
relevance_score = true_score / (true_score + false_score)

print(f"Reasoning chain: {text}")
print(f"Relevance score: {relevance_score}")

高级用法

from mteb import MTEB
from rank1 import rank1  # From the official repo

# Initialize the model
model = rank1(
    model_name_or_path="jhu-clsp/rank1-0.5b",
    num_gpus=1,
    device="cuda"
)

# Run evaluation on specific tasks
evaluation = MTEB(tasks=["NevIR"])
results = evaluation.run(model)

📚 详细文档

模型描述

属性	详情
模型类型	rank1是一种推理重排序模型，在进行相关性判断之前会进行“思考”。
训练数据	使用`jhu-clsp/rank1-training-data`数据集进行训练。

模型家族

模型	基础模型	描述
rank1-0.5b	Qwen2.5-0.5B	当前模型（0.5B参数）
rank1-1.5b	Qwen2.5-1.5B	更大的变体（1.5B参数）
rank1-3b	Qwen2.5-3B	更大的变体（3B参数）
rank1-7b	Qwen2.5-7B	更大的变体（7B参数）
rank1-14b	Qwen2.5-14B	更大的变体（14B参数）
rank1-32b	Qwen2.532B	最大的变体（32B参数）
rank1-mistral-2501-24b	Mistral-Small 2501 24B	基于Mistral基础模型训练
rank1-llama3-8b	Llama 3.1 8B	基于Llama 3.1基础模型训练

量化变体

模型	描述
rank1-7b-awq	rank1-7b的量化版本
rank1-14b-awq	rank1-14b的量化版本
rank1-32b-awq	rank1-32b的量化版本
rank1-mistral-2501-24b-awq	rank1-mistral-24b的量化版本
rank1-llama3-8b-awq	rank1-llama3-8b的量化版本

资源	描述
rank1-r1-msmarco	来自MS MARCO的所有R1输出示例
rank1-training-data	用于rank1模型的训练数据
rank1-run-files	用于前100文档重排序的预计算运行文件
GitHub仓库	rank1的官方仓库

性能

rank1-0.5b在检索基准测试中表现出色，特别是在需要复杂推理的任务上。该模型“思考”相关性决策的能力使其在处理细微主题时特别有效。如需具体的基准测试结果以及与其他模型的比较，请参考论文和官方GitHub仓库。

🔧 技术细节

rank1在信息检索中引入了一种新颖的方法，即在进行相关性判断之前生成明确的推理链。与直接输出分数的传统重排序器不同，rank1会接收查询和文档对，在<think>...</think>部分生成推理链，做出二元相关性判断（true或false），并根据真假标记的对数几率返回置信度分数。这种方法有助于模型将复杂的相关性决策分解为逻辑步骤，提高了在各种检索任务中的性能。