B

Bsc Bio Es

由 PlanTL-GOB-ES 开发
专为西班牙语生物医学领域设计的预训练语言模型,适用于临床NLP任务
下载量 162
发布时间 : 4/8/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的生物医学领域专用模型,在9.63亿词元的西班牙语生物医学语料上训练,支持掩码语言建模任务,特别适合临床文本处理

模型特点

领域专业化
专门针对西班牙语生物医学文本训练,包含临床病例、医学文献等专业语料
高性能表现
在PharmaCoNER等三项临床NER任务上超越通用和多语言模型
大规模训练数据
使用9.63亿词元的清洗后生物医学语料训练,包含医疗爬虫、临床病例、专利数据等多源数据

模型能力

生物医学文本理解
临床实体识别
医学文本分类
医学文本填空补全

使用案例

临床信息提取
药物名称识别
从临床文本中识别化学与药物提及
在PharmaCoNER任务上达到0.8907 F1分数
肿瘤术语识别
识别西班牙语肿瘤形态学术语
在CANTEMIST任务上达到0.8220 F1分数
临床文档分析
出院报告分析
处理卒中患者出院报告中的临床变量
在ICTUSnet数据集上达到0.8727 F1分数