B

Bert Base Uncased Squadv1 X2.01 F89.2 D30 Hybrid Rewind Opt V1

由 madlag 开发
基于BERT-base uncased模型在SQuAD v1上微调的问答系统模型,通过nn_pruning库进行剪枝优化,推理速度提升2.01倍,F1得分提升0.69。
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对问答任务优化的BERT模型,通过结构化剪枝和蒸馏技术实现高效推理,适用于从给定文本中提取答案的任务。

模型特点

高效推理
通过结构化剪枝技术,模型运行速度达到原始BERT的2.01倍
性能提升
F1得分89.19,较原始BERT提升0.69
注意力头优化
144个注意力头中移除了55个(38.2%),保留关键注意力模式
激活函数优化
将GeLU替换为ReLU以加速推理,无需特殊处理

模型能力

文本问答
上下文理解
答案提取

使用案例

教育
历史知识问答
从历史文本中提取特定问题的答案
准确识别埃菲尔铁塔位置等事实信息
信息检索
文档问答系统
从技术文档中快速定位答案
F1得分89.19的准确率