EriBERTa是一个基于海量医学临床语料库预训练的双语领域专用语言模型,在临床领域超越了既往所有西班牙语模型,展现出卓越的医学文本理解与信息提取能力。
下载量 728
发布时间 : 6/11/2024
模型简介
面向临床自然语言处理的双语预训练语言模型,支持英语和西班牙语,专注于生物医学和医疗领域的文本理解与信息提取。
模型特点
双语医学专业模型
专门针对英语和西班牙语医学临床文本进行预训练,在医学领域表现优异
跨语言知识迁移
能够实现英语和西班牙语之间的知识迁移,特别适合西班牙语临床数据稀缺的场景
大规模医学语料训练
基于多语言医学语料库(HiTZ/多语言医学语料库)进行预训练,处理了45亿token
模型能力
医学文本理解
临床信息提取
双语文本处理
掩码语言预测
使用案例
临床文本分析
医学报告异常检测
分析医学报告中的异常情况,如'全身骨骼X光片未检测到<mask>异常'
能够准确预测医学报告中的专业术语
手术记录分析
理解手术记录中的专业术语,如'经皮冠状动脉<mask>手术'
能够正确预测手术类型和术语
临床检查分析
检查结果解读
解读临床检查结果,如'无<mask>或角膜炎迹象'
能够准确预测检查结果中的专业医学术语
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文