B

Bert Base Uncased Squadv1 X2.44 F87.7 D26 Hybrid Filled V1

由 madlag 开发
基于BERT-base uncased模型在SQuAD v1上微调并通过nn_pruning库修剪的问答模型,保留42%原始权重,推理速度提升2.44倍
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对问答任务优化的BERT模型,通过结构化修剪技术减少参数规模并提升推理效率,适用于英文问答场景

模型特点

高效推理
通过结构化修剪使推理速度达到原模型的2.44倍
参数优化
保留42%原始权重(线性层仅保留26%),模型文件从420MB缩减至355MB
注意力头修剪
144个注意力头中移除了80个(55.6%),优化计算效率

模型能力

英文问答
上下文理解
文本提取

使用案例

智能客服
产品知识问答
基于产品文档自动回答客户咨询
F1分数87.71
教育辅助
学习资料问答
从教材文本中提取问题答案
EM分数80.03