W

Wikimedical Sent Biobert Multi

由 nuvocare 开发
基于sentence-transformers的多语言医学文本句子嵌入模型,支持8种语言
下载量 14
发布时间 : 10/20/2023
模型介绍
内容详情
替代品

模型简介

该模型能将医学相关句子和段落映射到768维向量空间,适用于跨语言的聚类或语义搜索任务。是WikiMedical_sent_biobert的多语言版本,基于xlm-roberta-base架构训练。

模型特点

多语言支持
支持英语、西班牙语、法语、德语等8种语言的医学文本处理
医学领域优化
专门针对维基医学内容优化的句子嵌入模型
知识蒸馏
采用教师-学生模型架构,从单语言BioBERT模型迁移知识到多语言模型

模型能力

句子向量化
跨语言语义搜索
文本聚类分析
医学文本相似度计算

使用案例

医疗信息检索
多语言医学文献检索
构建跨语言的医学文献搜索引擎
可实现对不同语言医学文献的语义相似度匹配
临床决策支持
多语言症状匹配
匹配不同语言描述的症状与疾病关联