S

S PubMedBert MS MARCO

由 pritamdeka 开发
基于PubMedBERT在MS-MARCO数据集上微调的句子转换模型,适用于医学/健康文本领域的语义相似度计算和信息检索任务
下载量 30.50k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型能将句子和段落映射到768维密集向量空间,支持医学领域的语义搜索和文本聚类任务。基于microsoft/BiomedNLP-PubMedBERT-base-uncased-abstract-fulltext模型微调,专门针对生物医学文本优化。

模型特点

医学领域优化
基于PubMedBERT预训练模型,在生物医学文本上表现优异
高效语义编码
能将句子和段落转换为768维语义向量,保留丰富的语义信息
MS-MARCO微调
在信息检索基准数据集MS-MARCO上进行了专门微调,适合检索任务

模型能力

句子嵌入生成
语义相似度计算
文本聚类
信息检索
医学文本特征提取

使用案例

医学信息检索
医学文献检索系统
构建基于语义相似度的医学文献检索系统,提高检索相关性
相比通用模型能更好理解医学术语和概念
患者问答匹配
将患者问题与医学知识库中的答案进行语义匹配
提高问答系统的准确率和用户体验
医学文本分析
医学报告聚类
对大量医学报告进行自动聚类分析
发现相似病例或研究趋势