S

Sapbert From PubMedBERT Fulltext

由 cambridgeltl 开发
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
下载量 1.7M
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SapBERT是针对生物医学领域设计的预训练模型,专注于提升生物医学实体名称的语义表征能力,特别擅长处理同义关系,适用于实体链接等任务。

模型特点

自对齐预训练
利用UMLS本体库的400万+概念进行度量学习优化,显著提升同义实体表征相似度
跨语言扩展
支持非英语生物医学实体表征(如中文示例'冠状病毒感染')
一体化解决方案
无需传统流水线系统即可实现医学实体链接,简化部署流程

模型能力

生物医学实体嵌入向量生成
跨语言实体语义匹配
同义实体识别
实体链接任务支持

使用案例

医学信息处理
电子病历实体标准化
将临床记录中的非标准术语映射到标准医学术语体系
在六个医学实体链接基准数据集上达到SOTA性能
生物医学文献检索
增强检索系统对医学术语同义关系的理解能力
显著提升检索召回率(具体数据未提供)