B

Bert Large Uncased Wwm Squadv2 X2.15 F83.2 D25 Hybrid V1

由 madlag 开发
该模型通过nn_pruning库修剪,保留了32%原始权重,运行速度是原版的2.15倍,F1值83.22
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于BERT-large架构的问答系统模型,针对SQuAD 2.0数据集微调,采用全词掩码技术,适用于英文问答任务

模型特点

高效修剪技术
通过nn_pruning库实现结构化修剪,线性层保留25%权重,整体保留32%权重
加速推理
运行速度达到原始BERT-large的2.15倍
注意力头优化
384个注意力头中修剪了155个(40.4%),提升计算效率

模型能力

英文问答
阅读理解
文本理解

使用案例

教育
学习辅助系统
帮助学生快速从教材中获取问题答案
F1值83.22的准确率
智能客服
FAQ自动回答
从知识库中自动检索问题答案