O

Openbioner Base

由 disi-unibo-nlp 开发
OpenBioNER 是一款专为开放领域生物医学命名实体识别(NER)定制的轻量级 BERT 模型,仅需目标实体类型的自然语言描述即可识别未见过的实体类型,无需重新训练。
下载量 210
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

OpenBioNER 通过大语言模型(LLM)自监督生成的合成银标数据进行预训练,在零样本设置下优于 UniNER 和 GPT-4o 等专用 LLM,在多个生物医学基准测试中 F1 分数最高提升 10%。

模型特点

零样本学习能力
仅需目标实体类型的自然语言描述即可识别未见过的实体类型,无需重新训练。
轻量级设计
参数量仅 110M,比 GLiNER 等基线模型减少多达 4 倍,性能却更优。
高性能表现
在多个生物医学基准测试中 F1 分数最高提升 10%,超越 GPT-4o 和 UniNER 等模型。

模型能力

生物医学命名实体识别
零样本学习
多实体类型识别

使用案例

生物医学研究
识别细菌名称
从生物医学文献中识别细菌名称,如肺炎链球菌(Streptococcus pneumoniae)。
在 BC2GM 数据集上 F1 分数达 49.1%
识别化学物质
从化学文献中识别化学物质名称。
在 BC4CHEMD 数据集上 F1 分数达 48.0%
医疗信息提取
识别疾病名称
从临床文本中识别疾病名称。
在 NCBI 数据集上 F1 分数达 58.5%