B

Biomednlp KRISSBERT PubMed UMLS EL

由 microsoft 开发
KRISSBERT是一个基于知识增强自监督学习的生物医学实体链接模型,通过利用无标注文本和领域知识训练上下文编码器,有效解决实体名称多样性变异和歧义性问题。
下载量 4,643
发布时间 : 4/15/2022
模型介绍
内容详情
替代品

模型简介

KRISSBERT是一个专注于生物医学领域的实体链接模型,能够理解上下文并准确链接到规范实体ID(如UMLS中的CUI),解决了传统方法无法处理未登录实体和缺乏上下文理解的问题。

模型特点

知识增强自监督学习
利用UMLS本体的生物医学实体名称和PubMed摘要进行自监督预训练,无需金标实体指称示例和所有实体的规范描述。
上下文理解
能够理解实体指称的上下文,准确消歧并链接到规范实体ID,而不仅仅是预测表面形式。
高性能
在七个标准生物医学实体链接数据集上实现了最先进性能,准确率较先前自监督方法最高提升20个百分点。

模型能力

生物医学实体链接
上下文理解
实体消歧

使用案例

生物医学研究
医学文献实体链接
将医学文献中的实体指称链接到UMLS中的规范实体ID,如将"ER"根据上下文链接到"急诊室"或"雌激素受体基因"。
在MedMentions数据集上达到约58.3%的Top-1准确率。