开源BERT问答模型 - 适合资源受限环境，基于SQuAD2.0微调精准问答

首页

Bert Medium Finetuned Squadv2

由 mrm8488 开发

基于BERT-Medium架构在SQuAD2.0数据集上微调的问答模型，专为计算资源受限环境设计

问答系统英语#问答系统 #轻量级BERT #SQuAD2.0微调

下载量 1,399

发布时间 : 3/2/2022

模型简介

该模型是Google Research开发的小型BERT系列之一，针对问答任务进行了优化，能够判断段落是否包含答案并做出相应响应

模型特点

轻量化设计

专为计算资源受限环境优化，模型大小仅为157MB

问答双模式

不仅能回答问题，还能判断段落是否支持答案

高效微调

在SQuAD2.0数据集上微调，平衡了模型大小与性能

模型能力

文本理解

问题回答

无答案判断

使用案例

智能客服

FAQ自动回答

基于知识库内容自动回答用户常见问题

准确率65.95% (EM)

教育辅助

阅读理解辅助

帮助学生快速定位文章中的关键信息

F1分数70.11%

🚀 BERT-Medium在SQuAD v2上微调模型

该模型由Google Research创建的BERT-Medium，并在数据集SQuAD 2.0上进行微调，用于问答下游任务。

模型大小（训练后）：157.46 MB

✨ 主要特性

BERT-Small及其“家族”详情（来自其文档）

该模型于2020年3月11日发布，是24个较小的BERT模型（仅英文，无大小写区分，使用WordPiece掩码训练）的一部分，相关内容参考论文《Well-Read Students Learn Better: On the Importance of Pre-training Compact Models》。

这些较小的BERT模型适用于计算资源受限的环境，它们可以像原始BERT模型一样进行微调。不过，在知识蒸馏的场景下它们最为有效，即微调标签由更大、更准确的“教师”模型生成。

下游任务（问答）详情 - 数据集

SQuAD2.0将SQuAD1.1中的100,000个问题与众包工作者对抗性编写的50,000多个无法回答的问题（这些问题看起来与可回答的问题相似）相结合。要在SQuAD2.0上表现良好，系统不仅要在可能的情况下回答问题，还要判断段落中何时没有支持答案的信息并避免作答。

数据集	划分	样本数量
SQuAD2.0	训练集	130k
SQuAD2.0	评估集	12.3k

📦 安装指南

该模型在Tesla P100 GPU和25GB RAM上进行训练，微调脚本可在此处找到。

📚 详细文档

结果

指标	值
精确匹配率（EM）	65.95
F1分数	70.11

训练脚本中基准测试的原始指标

{
  "exact": 65.95637159942727,
  "f1": 70.11632254245896,
  "total": 11873,
  "HasAns_exact": 67.79689608636977,
  "HasAns_f1": 76.12872765631123,
  "HasAns_total": 5928,
  "NoAns_exact": 64.12111017661901,
  "NoAns_f1": 64.12111017661901,
  "NoAns_total": 5945,
  "best_exact": 65.96479407058031,
  "best_exact_thresh": 0.0,
  "best_f1": 70.12474501361196,
  "best_f1_thresh": 0.0
}

模型对比

模型	精确匹配率（EM）	F1分数	大小（MB）
bert-tiny-finetuned-squadv2	48.60	49.73	16.74
bert-tiny-5-finetuned-squadv2	57.12	60.86	24.34
bert-mini-finetuned-squadv2	56.31	59.65	42.63
bert-mini-5-finetuned-squadv2	63.51	66.78	66.76
bert-small-finetuned-squadv2	60.49	64.21	109.74
bert-medium-finetuned-squadv2	65.95	70.11	157.46

💻 使用示例

基础用法

from transformers import pipeline

qa_pipeline = pipeline(
    "question-answering",
    model="mrm8488/bert-small-finetuned-squadv2",
    tokenizer="mrm8488/bert-small-finetuned-squadv2"
)

qa_pipeline({
    'context': "Manuel Romero has been working hardly in the repository hugginface/transformers lately",
    'question': "Who has been working hard for hugginface/transformers lately?"

})

# Output:

{
  "answer": "Manuel Romero",
  "end": 13,
  "score": 0.9939319924374637,
  "start": 0
}

高级用法

qa_pipeline({
    'context': "Manuel Romero has been working remotely in the repository hugginface/transformers lately",
    'question': "How has been working Manuel Romero?"
})

# Output:

{ "answer": "remotely", "end": 39, "score": 0.3612058272768017, "start": 31 }

运行成功！🎉🎉🎉

由Manuel Romero/@mrm8488创建 | 领英

于西班牙用心打造 ♥

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文