B

Bsc Bio Ehr Es

由 PlanTL-GOB-ES 开发
针对西班牙语生物医学和临床文本优化的预训练语言模型,支持临床NLP任务
下载量 624
发布时间 : 4/8/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的西班牙语生物医学领域专用模型,在混合生物医学语料和真实临床记录上训练,适用于临床文本分析任务

模型特点

专业领域优化
在10亿token的生物医学-临床混合语料上训练,包含27.8万份真实临床文档
多源数据整合
整合医学爬虫、临床病例、电子健康记录等11种专业数据源
临床NER优势
在PharmaCoNER、CANTEMIST等临床NER任务上超越通用和多语言模型

模型能力

生物医学文本理解
临床实体识别
电子健康记录分析
医学文本分类

使用案例

临床信息提取
药物名称识别
从临床文本中识别化学药物提及
在PharmaCoNER任务达到0.8913 F1分数
肿瘤形态学识别
识别西班牙语肿瘤学术语
在CANTEMIST任务达到0.8340 F1分数
电子健康记录处理
出院报告分析
解析卒中患者出院报告中的临床变量
在ICTUSnet数据集达到0.8756 F1分数