许可证:其他
许可证名称:公共领域
许可证链接:LICENSE
使用方法:针对给定查询对文章进行排序
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("ncbi/MedCPT-Cross-Encoder")
model = AutoModelForSequenceClassification.from_pretrained("ncbi/MedCPT-Cross-Encoder")
query = "糖尿病治疗"
articles = [
"1型和2型糖尿病:当前治疗方法及基因治疗潜在干预的综述。1型和2型糖尿病是一种严重的终身性疾病,通常以血糖水平异常升高为特征,这是由于胰岛素分泌不足或胰岛素敏感性和功能下降所致。[...]",
"糖尿病及其慢性并发症。糖尿病是发病率和死亡率的主要原因,也是早发冠心病的主要危险因素。糖尿病的并发症包括视网膜病变、肾病和周围神经病变。[...]",
"成人中枢性尿崩症的诊断与管理。中枢性尿崩症(CDI)是一种临床综合征,源于下丘脑/垂体后叶加压素能神经元的丧失或功能受损,导致精氨酸加压素(AVP)的合成和/或分泌受损。[...]",
"无渴性尿崩症。无渴性尿崩症(ADI)是一种罕见但破坏性极强的水平衡障碍,伴有显著的发病率和死亡率。大多数患者因下丘脑受到各种潜在病因的破坏而发病。[...]",
"肾性尿崩症:全面概述。肾性尿崩症(NDI)的特征是无法浓缩尿液,导致多尿和多饮,尽管血浆精氨酸加压素(AVP)浓度正常或升高。[...]",
"盐摄入对高血压发病机制和治疗的影响。过量摄入膳食盐(氯化钠)与高血压风险增加相关,而高血压尤其是中风和其他心血管疾病的主要危险因素,但也包括肾脏疾病。此外,高盐摄入或偏好咸食被认为与胃癌呈正相关,根据最近的研究,可能还与肥胖风险相关。[...]"
]
pairs = [[query, article] for article in articles]
with torch.no_grad():
encoded = tokenizer(
pairs,
truncation=True,
padding=True,
return_tensors="pt",
max_length=512,
)
logits = model(**encoded).logits.squeeze(dim=1)
print(logits)
输出结果如下:
tensor([ 6.9363, -8.2063, -8.7692, -12.3450, -10.4416, -15.8475])
分数越高表示相关性越高。
致谢
这项工作得到了美国国立卫生研究院、国家医学图书馆内部研究计划的支持。
免责声明
本工具展示了NCBI/NLM计算生物学分支的研究成果。本网站提供的信息未经临床专业人员审查和监督,不直接用于诊断或医疗决策。个人不应仅基于本网站提供的信息改变其健康行为。NIH不独立验证本工具生成信息的有效性或实用性。如果您对本网站提供的信息有疑问,请咨询医疗保健专业人员。有关NCBI免责政策的更多信息,请参阅相关页面。
引用
如果您觉得本仓库有帮助,请引用MedCPT:
@article{jin2023medcpt,
title={MedCPT:基于大规模PubMed搜索日志的对比预训练转换器用于零样本生物医学信息检索},
author={Jin, Qiao and Kim, Won and Chen, Qingyu and Comeau, Donald C and Yeganova, Lana and Wilbur, W John and Lu, Zhiyong},
journal={生物信息学},
volume={39},
number={11},
pages={btad651},
year={2023},
publisher={牛津大学出版社}
}