B

Bio Lm

由 EMBO 开发
基于RoBERTa基础预训练模型,在生命科学领域的英文科学文本上进一步训练的语言模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于生命科学领域的文本处理任务,特别适合针对下游任务(如标记分类)进行微调

模型特点

生命科学领域专业化
在1200万条生命科学领域论文摘要和图表说明上训练,具有领域专业性
易于微调
特别适合针对下游任务(如标记分类)进行微调
高性能
在测试集上达到0.814的召回率表现

模型能力

生命科学文本理解
掩码语言建模
文本分类
领域特定文本处理

使用案例

科学研究
科学文献分析
用于处理和分析生命科学领域的论文摘要
能够准确理解专业术语和上下文
生物医学文本分类
对生物医学文献进行分类标记
适合微调后用于特定分类任务