B

Bert Base Uncased Squadv1 X1.84 F88.7 D36 Hybrid Filled V1

由 madlag 开发
这是一个通过nn_pruning库剪枝优化的问答模型,保留了50%原始权重,在SQuAD v1上微调,F1值达88.72
下载量 30
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于BERT架构,针对问答任务优化,通过结构化剪枝提升推理速度1.84倍,同时保持高准确率

模型特点

高效剪枝技术
通过nn_pruning库实现结构化剪枝,保留36%线性层权重,整体保留50%模型参数
加速推理
推理速度达到密集模型的1.84倍,得益于优化的矩阵结构
注意力头优化
移除了33.3%的注意力头(144个中移除48个),提升计算效率
性能提升
F1值比原始模型提升0.22(88.72 vs 88.5),EM值提升0.89(81.69 vs 80.8)

模型能力

文本理解
问题回答
上下文提取

使用案例

教育
阅读理解辅助
帮助学生快速从文本中获取问题答案
在SQuAD测试集上F1达88.72
知识管理
文档问答系统
从技术文档中自动提取问题答案