S

Sapbert From PubMedBERT Fulltext Mean Token

由 cambridgeltl 开发
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
下载量 244.39k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SapBERT是基于PubMedBERT架构的生物医学实体表征模型,专门针对生物医学领域的细粒度语义关系进行优化,特别适用于实体链接等需要建模同义关系的任务。

模型特点

自对齐预训练
通过专门设计的度量学习框架,利用UMLS生物医学本体库优化实体表征空间
一体化解决方案
为医学实体链接(MEL)问题提供端到端解决方案,无需复杂的流水线系统
跨语言扩展
具备跨语言扩展能力,相关研究在ACL 2021和NAACL 2021发表

模型能力

生物医学实体表征
语义关系建模
实体链接
同义词识别

使用案例

医学信息处理
医学实体链接
将不同来源的医学术语链接到统一医学语言系统(UMLS)中的标准概念
在六个MEL基准数据集上实现了最新最优性能
科学文献分析
分析科学文献中的生物医学术语关系
即使没有任务特定监督,仍能达到最优水平