R

Roberta Base Biomedical Es

由 PlanTL-GOB-ES 开发
专为西班牙语生物医学领域设计的RoBERTa架构预训练语言模型,适用于临床文本处理任务
下载量 335
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的中等规模生物医学语言模型,在9.63亿标记的西班牙语生物医学语料上训练,支持掩码语言建模任务,特别适合生物医学文本的命名实体识别和文本分类

模型特点

领域专业化
专门针对西班牙语生物医学领域优化,在临床文本处理上表现优于通用模型
高质量语料
使用经过严格清洗的9.63亿标记生物医学语料训练,整合了多个权威医学数据源
高效训练
采用与原始RoBERTa相同的训练参数,在16块V100 GPU上仅需48小时完成训练

模型能力

生物医学文本填空
临床命名实体识别
医学文本分类
生物医学信息抽取

使用案例

临床文档处理
病史自动补全
自动补全临床记录中的专业术语
示例显示对'动脉<mask>'的补全准确率达98.5%
放射学报告分析
识别影像报告中的异常描述
在骨骼X光报告中准确识别异常描述
医学研究
文献信息抽取
从医学文献中提取关键临床信息