E

Eriberta Base

由 HiTZ 开发
EriBERTa是一个基于海量医学临床语料库预训练的双语领域专用语言模型,在临床领域超越了既往所有西班牙语模型,展现出卓越的医学文本理解与信息提取能力。
下载量 728
发布时间 : 6/11/2024
模型介绍
内容详情
替代品

模型简介

面向临床自然语言处理的双语预训练语言模型,支持英语和西班牙语,专注于生物医学和医疗领域的文本理解与信息提取。

模型特点

双语医学专业模型
专门针对英语和西班牙语医学临床文本进行预训练,在医学领域表现优异
跨语言知识迁移
能够实现英语和西班牙语之间的知识迁移,特别适合西班牙语临床数据稀缺的场景
大规模医学语料训练
基于多语言医学语料库(HiTZ/多语言医学语料库)进行预训练,处理了45亿token

模型能力

医学文本理解
临床信息提取
双语文本处理
掩码语言预测

使用案例

临床文本分析
医学报告异常检测
分析医学报告中的异常情况,如'全身骨骼X光片未检测到<mask>异常'
能够准确预测医学报告中的专业术语
手术记录分析
理解手术记录中的专业术语,如'经皮冠状动脉<mask>手术'
能够正确预测手术类型和术语
临床检查分析
检查结果解读
解读临床检查结果,如'无<mask>或角膜炎迹象'
能够准确预测检查结果中的专业医学术语