hypencoder.8_layer开源信息检索模型 - 免费将文本转网络算相关分数

首页

Hypencoder.8 Layer

由 jfkback 开发

Hypencoder是一种用于信息检索的双编码器模型，包含文本编码器和超网络（Hypencoder），能够将文本转换为小型神经网络用于计算相关性分数。

文本嵌入

Transformers

英语开源协议:MIT #双编码器架构 #超网络检索 #动态相关性评分

下载量 18

发布时间 : 2/12/2025

模型简介

该模型通过双编码器架构实现信息检索功能，其中文本编码器将项目转换为768维向量，Hypencoder则将文本转换为小型神经网络，用于输出相关性分数。

模型特点

超网络架构

使用Hypencoder将文本转换为小型神经网络，动态生成相关性评分函数

可配置隐藏层

提供2/4/6/8层隐藏层的不同变体，可根据需求选择模型复杂度

双编码器设计

结合传统文本编码器和创新的Hypencoder，实现高效的信息检索

模型能力

文本特征提取

使用案例

搜索引擎

查询-文档相关性评估

计算用户查询与候选文档之间的相关性分数

可有效排序检索结果

问答系统

答案候选排序

对问答系统中的候选答案进行相关性排序

提高答案准确率

🚀 Hypencoder模型

Hypencoder是一种用于信息检索的模型，基于超网络架构，能将文本转换为相关得分，在信息检索任务中表现出色。

🚀 快速开始

本模型是论文 Hypencoder: Hypernetworks for Information Retrieval 中的官方模型。若要使用该模型，请查看 Github 页面，其中包含所需代码和运行模型的详细说明。

✨ 主要特性

这是一个Hypencoder双编码器，包含文本编码器和Hypencoder两个主干部分。
文本编码器将文本项转换为768维向量，Hypencoder则将文本转换为一个小型神经网络，该网络以文本编码器输出的768维向量为输入，最终输出相关性得分。

📦 安装指南

文档未提供具体安装步骤，故跳过该章节。

💻 使用示例

基础用法

from hypencoder_cb.modeling.hypencoder import Hypencoder, HypencoderDualEncoder, TextEncoder
from transformers import AutoTokenizer

dual_encoder = HypencoderDualEncoder.from_pretrained("jfkback/hypencoder.6_layer")
tokenizer = AutoTokenizer.from_pretrained("jfkback/hypencoder.6_layer")

query_encoder: Hypencoder = dual_encoder.query_encoder
passage_encoder: TextEncoder = dual_encoder.passage_encoder

queries = [
    "how many states are there in india",
    "when do concussion symptoms appear",
]

passages = [
    "India has 28 states and 8 union territories.",
    "Concussion symptoms can appear immediately or up to 72 hours after the injury.",
]

query_inputs = tokenizer(queries, return_tensors="pt", padding=True, truncation=True)
passage_inputs = tokenizer(passages, return_tensors="pt", padding=True, truncation=True)

q_nets = query_encoder(input_ids=query_inputs["input_ids"], attention_mask=query_inputs["attention_mask"]).representation
passage_embeddings = passage_encoder(input_ids=passage_inputs["input_ids"], attention_mask=passage_inputs["attention_mask"]).representation

# The passage_embeddings has shape (2, 768), but the q_nets expect the shape
# (num_queries, num_items_per_query, input_hidden_size) so we need to reshape
# the passage_embeddings.

# In the simple case where each q_net only takes one passage, we can just
# reshape the passage_embeddings to (num_queries, 1, input_hidden_size).
passage_embeddings_single = passage_embeddings.unsqueeze(1)
scores = q_nets(passage_embeddings_single)  # Shape (2, 1, 1)
# [
#    [[-12.1192]],
#    [[-13.5832]]
# ]

# In the case where each q_net takes both passages we can reshape the
# passage_embeddings to (num_queries, 2, input_hidden_size).
passage_embeddings_double = passage_embeddings.repeat(2, 1).reshape(2, 2, -1)
scores = q_nets(passage_embeddings_double)  # Shape (2, 2, 1)
# [
#    [[-12.1192], [-32.7046]],
#    [[-34.0934], [-13.5832]]
# ]

📚 详细文档

模型变体

我们发布了论文中使用的四个模型。除了被称为q - nets的小型神经网络的隐藏层数量不同外，每个模型的其他部分相同。

Huggingface仓库	层数
jfkback/hypencoder.2_layer	2
jfkback/hypencoder.4_layer	4
jfkback/hypencoder.6_layer	6
jfkback/hypencoder.8_layer	8

模型信息

属性	详情
基础模型	google-bert/bert-base-uncased
数据集	microsoft/ms_marco
语言	en
库名称	transformers
任务类型	特征提取

🔧 技术细节

文档未提供具体技术细节内容，故跳过该章节。

📄 许可证

本项目采用MIT许可证。

📚 引用

如果您在研究中使用了该模型，请使用以下BibTeX引用：

@misc{killingback2025hypencoderhypernetworksinformationretrieval,
      title={Hypencoder: Hypernetworks for Information Retrieval}, 
      author={Julian Killingback and Hansi Zeng and Hamed Zamani},
      year={2025},
      eprint={2502.05364},
      archivePrefix={arXiv},
      primaryClass={cs.IR},
      url={https://arxiv.org/abs/2502.05364}, 
}