flan-t5-base-squad2开源问答模型 - 免费部署处理含无答案的问答对

首页

Flan T5 Base Squad2

由 sjrhuschlee 开发

基于flan-t5-base模型，使用SQuAD2.0数据集微调的抽取式问答模型，可处理包含无答案问题的问答对。

问答系统

Transformers

英语开源协议:MIT #抽取式问答 #无答案检测 #SQuAD2.0微调

下载量 2,425

发布时间 : 6/14/2023

模型简介

该模型专门用于英语抽取式问答任务，特别擅长处理SQuAD2.0数据集中的问题，包括判断问题是否无答案的情况。

模型特点

无答案问题处理

通过特殊<cls>标记识别无答案情况，专门针对SQuAD2.0数据集优化

多数据集适配

在SQuAD、SQuAD2.0及多个变体数据集上表现良好

高效推理

在单个NVIDIA 3070显卡上即可运行

模型能力

抽取式问答

无答案检测

英语文本理解

使用案例

智能客服

常见问题解答

从知识库中提取精确答案回答用户问题

在SQuAD验证集上达到86.37%的精确匹配率

教育辅助

阅读理解评估

评估学生对文章内容的理解程度

在SQuAD2.0验证集上F1分数达85.28

🚀 flan-t5-base用于抽取式问答

本项目采用经 SQuAD2.0 数据集微调的 flan-t5-base 模型，针对抽取式问答任务，在包含不可回答问题的问答对上进行训练。

更新说明：在 transformers 4.31.0 版本之后，不再需要 use_remote_code=True。

注意事项：为使模型正常工作，必须手动在问题开头添加 <cls> 标记。该模型使用 <cls> 标记来进行“无答案”预测。由于 t5 分词器不会自动添加此特殊标记，因此需要手动添加。

🚀 快速开始

模型概述

属性	详情
语言模型	flan-t5-base
语言	英语
下游任务	抽取式问答
训练数据	SQuAD 2.0
评估数据	SQuAD 2.0
基础设施	1x NVIDIA 3070

模型使用示例

import torch
from transformers import(
  AutoModelForQuestionAnswering,
  AutoTokenizer,
  pipeline
)
model_name = "sjrhuschlee/flan-t5-base-squad2"

# a) 使用管道
nlp = pipeline(
  'question-answering',
  model=model_name,
  tokenizer=model_name,
  # trust_remote_code=True, # 如果 transformers 版本 >= 4.31.0 则无需使用
)
qa_input = {
'question': f'{nlp.tokenizer.cls_token}Where do I live?',  # '<cls>Where do I live?'
'context': 'My name is Sarah and I live in London'
}
res = nlp(qa_input)
# {'score': 0.980, 'start': 30, 'end': 37, 'answer': ' London'}

# b) 加载模型和分词器
model = AutoModelForQuestionAnswering.from_pretrained(
  model_name,
  # trust_remote_code=True # 如果 transformers 版本 >= 4.31.0 则无需使用
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

question = f'{tokenizer.cls_token}Where do I live?'  # '<cls>Where do I live?'
context = 'My name is Sarah and I live in London'
encoding = tokenizer(question, context, return_tensors="pt")
output = model(
  encoding["input_ids"],
  attention_mask=encoding["attention_mask"]
)

all_tokens = tokenizer.convert_ids_to_tokens(encoding["input_ids"][0].tolist())
answer_tokens = all_tokens[torch.argmax(output["start_logits"]):torch.argmax(output["end_logits"]) + 1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))
# 'London'

评估指标

# Squad v2
{
    "eval_HasAns_exact": 79.97638326585695,
    "eval_HasAns_f1": 86.1444296592862,
    "eval_HasAns_total": 5928,
    "eval_NoAns_exact": 84.42388561816652,
    "eval_NoAns_f1": 84.42388561816652,
    "eval_NoAns_total": 5945,
    "eval_best_exact": 82.2033184536343,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 85.28292588395921,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 82.2033184536343,
    "eval_f1": 85.28292588395928,
    "eval_runtime": 522.0299,
    "eval_samples": 12001,
    "eval_samples_per_second": 22.989,
    "eval_steps_per_second": 0.96,
    "eval_total": 11873
}

# Squad
{
    "eval_exact_match": 86.3197729422895,
    "eval_f1": 92.94686836210295,
    "eval_runtime": 442.1088,
    "eval_samples": 10657,
    "eval_samples_per_second": 24.105,
    "eval_steps_per_second": 1.007
}