C

Camembert Bio Base

由 almanach 开发
CamemBERT-bio是一款专为法语生物医学领域优化的语言模型,基于camembert-base进行持续预训练,在生物医学命名实体识别任务上表现优异。
下载量 6,029
发布时间 : 2/23/2023

模型简介

CamemBERT-bio是一款先进的法语生物医学语言模型,通过在大规模法语生物医学语料库上的持续预训练,显著提升了在生物医学命名实体识别任务上的性能。

模型特点

专业领域优化
专为法语生物医学领域设计,在生物医学命名实体识别任务上表现出色,相比基础模型有显著的性能提升。
丰富语料训练
使用包含科学文献、药品说明书和临床病例的大规模法语生物医学语料库进行训练,数据涵盖面广。
高效训练
采用持续预训练方法,相比从头训练计算成本更低,效率更高。

模型能力

法语生物医学文本理解
生物医学命名实体识别
临床文档信息提取

使用案例

临床研究
医疗报告信息提取
从医院临床数据仓库的非结构化文档中提取信息以支持临床研究
在临床数据集上F1分数提升2.54分
药品信息处理
药品说明书分析
从药品说明书中提取关键信息
在EMEA数据集上F1分数达到76.71
科学文献处理
生物医学文献分析
处理和分析法语生物医学科学文献
在MEDLINE数据集上F1分数达到68.47
AIbase
智启未来,您的人工智能解决方案智库
简体中文