S

Sd Ner

由 EMBO 开发
基于RoBERTa基础模型,在生命科学领域英文科学文本上进行微调的命名实体识别模型
下载量 14
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于识别SourceData标注系统中的生物实体,包括小分子、基因产物、亚细胞组分等7类生物医学实体

模型特点

生物医学领域专用
针对生命科学文献进行优化,能准确识别生物医学实体
多类别实体识别
可识别7类生物医学实体,包括基因产物、小分子等
基于RoBERTa优化
在RoBERTa基础模型上通过生物医学语料库进一步训练

模型能力

生物医学实体识别
科学文本分析
多类别分类

使用案例

生物医学文献分析
科研论文实体提取
从生命科学领域的论文中提取关键生物实体
F1值达0.74(微观平均)
实验数据标注
自动标注实验方法、细胞类型等关键信息
基因产物识别F1值达0.82