S

Scibert Scivocab Uncased Squad V2

由 ktrapeznikov 开发
基于BERT架构的科学领域预训练语言模型,使用科学文献词汇表进行训练
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SciBERT是一个专门针对科学文献预训练的BERT模型,使用科学领域的词汇表(SciVocab)进行训练,适合处理科学文本相关的自然语言处理任务

模型特点

科学领域优化
使用科学文献专用词汇表(SciVocab)训练,对科学文本处理有更好表现
SQuAD V2微调
在SQuAD V2问答数据集上微调,支持判断段落是否包含答案的能力
高效训练
支持混合精度(FP16)训练,在4块RTX 2080 Ti上实现高效训练

模型能力

科学文本理解
问答系统
无答案检测
文本跨度预测

使用案例

学术研究
科学文献问答系统
从科学论文中自动提取问题答案
在SQuAD V2开发集上达到75.08的exact匹配分数
研究助手
帮助研究人员快速查找文献中的特定信息
教育技术
智能学习系统
为学生提供基于科学教材的自动问答功能