flan-t5-large-squad2开源问答模型 - 精准处理可答与不可答问题

首页

Flan T5 Large Squad2

由 sjrhuschlee 开发

基于flan-t5-large模型，使用SQuAD2.0数据集微调的抽取式问答模型，支持可回答和不可回答问题的处理。

问答系统

Transformers

英语开源协议:MIT #抽取式问答 #LoRA微调 #SQuAD2.0适配

下载量 57

发布时间 : 6/14/2023

模型简介

该模型针对英语抽取式问答任务进行了优化，特别处理了SQuAD2.0数据集中包含的可回答和不可回答问题对。

模型特点

LoRA微调技术

使用PEFT库的LoRA技术进行高效微调，保持模型性能的同时减少计算资源需求

特殊标记处理

使用<cls>标记来预测'无答案'情况，有效处理不可回答问题

多数据集验证

在SQuAD、SQuAD2.0及多个对抗性数据集上进行了全面验证

模型能力

抽取式问答

不可回答问题检测

上下文理解

使用案例

智能客服

FAQ自动回答

基于知识库内容自动回答用户常见问题

在SQuAD2.0验证集上达到86.8%的精确匹配率

教育

阅读理解辅助

帮助学生理解文章并回答相关问题

在SQuAD验证集上F1值达到95.06

🚀 flan-t5-large用于抽取式问答

本项目基于 flan-t5-large 模型，使用 SQuAD2.0 数据集进行微调。该模型针对抽取式问答任务，在问答对（包括无法回答的问题）上进行了训练。

更新：在 transformers 4.31.0 版本之后，不再需要 use_remote_code=True。

此模型使用了通过 PEFT 库实现的 LoRA 进行训练。

注意：为使模型正常工作，必须手动在问题开头添加 <cls> 标记。模型使用 <cls> 标记来进行“无答案”的预测。由于 t5 分词器不会自动添加这个特殊标记，因此需要手动添加。

🚀 快速开始

模型概述

属性	详情
语言模型	flan-t5-large
语言	英语
下游任务	抽取式问答
训练数据	SQuAD 2.0
评估数据	SQuAD 2.0
基础设施	1x NVIDIA 3070

模型使用

使用 Transformers 库

此方法使用合并后的权重（基础模型权重 + LoRA 权重），以便在 Transformers 管道中简单使用。在使用 PEFT 库时，其性能与分别使用权重相同。

import torch
from transformers import(
  AutoModelForQuestionAnswering,
  AutoTokenizer,
  pipeline
)
model_name = "sjrhuschlee/flan-t5-large-squad2"

# a) 使用管道
nlp = pipeline(
  'question-answering',
  model=model_name,
  tokenizer=model_name,
  # trust_remote_code=True, # 如果 transformers 版本 >= 4.31.0 则无需使用
)
qa_input = {
'question': f'{nlp.tokenizer.cls_token}Where do I live?',  # '<cls>Where do I live?'
'context': 'My name is Sarah and I live in London'
}
res = nlp(qa_input)
# {'score': 0.984, 'start': 30, 'end': 37, 'answer': ' London'}

# b) 加载模型和分词器
model = AutoModelForQuestionAnswering.from_pretrained(
  model_name,
  # trust_remote_code=True # 如果 transformers 版本 >= 4.31.0 则无需使用
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

question = f'{tokenizer.cls_token}Where do I live?'  # '<cls>Where do I live?'
context = 'My name is Sarah and I live in London'
encoding = tokenizer(question, context, return_tensors="pt")
output = model(
  encoding["input_ids"],
  attention_mask=encoding["attention_mask"]
)

all_tokens = tokenizer.convert_ids_to_tokens(encoding["input_ids"][0].tolist())
answer_tokens = all_tokens[torch.argmax(output["start_logits"]):torch.argmax(output["end_logits"]) + 1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))
# 'London'

评估指标

# Squad v2
{
    "eval_HasAns_exact": 85.08771929824562,
    "eval_HasAns_f1": 90.598422845031,
    "eval_HasAns_total": 5928,
    "eval_NoAns_exact": 88.47771236333053,
    "eval_NoAns_f1": 88.47771236333053,
    "eval_NoAns_total": 5945,
    "eval_best_exact": 86.78514276088605,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 89.53654936623764,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 86.78514276088605,
    "eval_f1": 89.53654936623776,
    "eval_runtime": 1908.3189,
    "eval_samples": 12001,
    "eval_samples_per_second": 6.289,
    "eval_steps_per_second": 0.787,
    "eval_total": 11873
}

# Squad
{
    "eval_HasAns_exact": 85.99810785241249,
    "eval_HasAns_f1": 91.296119057944,
    "eval_HasAns_total": 10570,
    "eval_best_exact": 85.99810785241249,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 91.296119057944,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 85.99810785241249,
    "eval_f1": 91.296119057944,
    "eval_runtime": 1508.9596,
    "eval_samples": 10657,
    "eval_samples_per_second": 7.062,
    "eval_steps_per_second": 0.883,
    "eval_total": 10570
}

使用 Peft 库

注意：此方法需要 PEFT 库的 PR https://github.com/huggingface/peft/pull/473 中的代码。

#!pip install peft

from peft import LoraConfig, PeftModelForQuestionAnswering
from transformers import AutoModelForQuestionAnswering, AutoTokenizer
model_name = "sjrhuschlee/flan-t5-large-squad2"