B

Bert Base Uncased Squadv1 X1.96 F88.3 D27 Hybrid Filled Opt V1

由 madlag 开发
基于BERT-base uncased模型在SQuAD v1上微调并优化的问答模型,通过剪枝技术保留43%原始权重,推理速度提升1.96倍
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对问答任务优化的BERT模型,通过nn_pruning工具进行剪枝优化,在保持较高准确率的同时显著提升推理速度

模型特点

高效剪枝技术
采用nn_pruning工具进行剪枝,保留27%线性层权重,整体保留43%原始权重
推理加速
通过结构化矩阵剪枝,推理速度达到原版的1.96倍
精度保持
F1值仅比原版下降0.17(88.33 vs 88.5),在显著加速的同时保持高准确率
注意力头优化
144个注意力头中剪除55个(38.2%),优化计算效率

模型能力

问答系统
文本理解
上下文提取

使用案例

智能问答
事实性问答
基于给定上下文回答具体问题
F1值88.33,EM值81.31
教育辅助
学习资料理解
帮助学生快速定位教材中的关键信息