B

Bsc Bio Es

由 PlanTL-GOB-ES 开发
专为西班牙语生物医学领域设计的预训练语言模型,适用于临床NLP任务
下载量 162
发布时间 : 4/8/2022

模型简介

基于RoBERTa架构的生物医学领域专用模型,在9.63亿词元的西班牙语生物医学语料上训练,支持掩码语言建模任务,特别适合临床文本处理

模型特点

领域专业化
专门针对西班牙语生物医学文本训练,包含临床病例、医学文献等专业语料
高性能表现
在PharmaCoNER等三项临床NER任务上超越通用和多语言模型
大规模训练数据
使用9.63亿词元的清洗后生物医学语料训练,包含医疗爬虫、临床病例、专利数据等多源数据

模型能力

生物医学文本理解
临床实体识别
医学文本分类
医学文本填空补全

使用案例

临床信息提取
药物名称识别
从临床文本中识别化学与药物提及
在PharmaCoNER任务上达到0.8907 F1分数
肿瘤术语识别
识别西班牙语肿瘤形态学术语
在CANTEMIST任务上达到0.8220 F1分数
临床文档分析
出院报告分析
处理卒中患者出院报告中的临床变量
在ICTUSnet数据集上达到0.8727 F1分数
AIbase
智启未来,您的人工智能解决方案智库
简体中文