许可证: mit
数据集:
- squad_v2
- squad
语言:
- en
库名称: transformers
流水线标签: question-answering
标签:
- question-answering
- squad
- squad_v2
- t5
模型索引:
- 名称: sjrhuschlee/flan-t5-base-squad2
结果:
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squad_v2
类型: squad_v2
配置: squad_v2
分割: validation
指标:
- 类型: exact_match
值: 82.203
名称: 精确匹配
- 类型: f1
值: 85.283
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squad
类型: squad
配置: plain_text
分割: validation
指标:
- 类型: exact_match
值: 86.367
名称: 精确匹配
- 类型: f1
值: 92.965
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: adversarial_qa
类型: adversarial_qa
配置: adversarialQA
分割: validation
指标:
- 类型: exact_match
值: 34.167
名称: 精确匹配
- 类型: f1
值: 46.911
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squad_adversarial
类型: squad_adversarial
配置: AddOneSent
分割: validation
指标:
- 类型: exact_match
值: 80.862
名称: 精确匹配
- 类型: f1
值: 86.070
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squadshifts amazon
类型: squadshifts
配置: amazon
分割: test
指标:
- 类型: exact_match
值: 71.624
名称: 精确匹配
- 类型: f1
值: 85.113
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squadshifts new_wiki
类型: squadshifts
配置: new_wiki
分割: test
指标:
- 类型: exact_match
值: 82.389
名称: 精确匹配
- 类型: f1
值: 91.259
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squadshifts nyt
类型: squadshifts
配置: nyt
分割: test
指标:
- 类型: exact_match
值: 83.736
名称: 精确匹配
- 类型: f1
值: 91.675
名称: F1分数
- 任务:
类型: question-answering
名称: 问答
数据集:
名称: squadshifts reddit
类型: squadshifts
配置: reddit
分割: test
指标:
- 类型: exact_match
值: 72.743
名称: 精确匹配
- 类型: f1
值: 84.273
名称: F1分数
用于抽取式问答的flan-t5-base模型
这是基于flan-t5-base模型,使用SQuAD2.0数据集进行微调的版本。该模型经过训练,可用于处理包含无答案问题的问答对,执行抽取式问答任务。
更新说明: 使用transformers 4.31.0及以上版本时,不再需要设置use_remote_code=True
参数。
重要提示: 为使模型正常工作,必须手动在问题开头添加<cls>
标记。该模型通过<cls>
标记来预测"无答案"情况。由于t5分词器不会自动添加这个特殊标记,因此需要手动添加。
模型概览
语言模型: flan-t5-base
语言: 英语
下游任务: 抽取式问答
训练数据: SQuAD 2.0
评估数据: SQuAD 2.0
硬件配置: 1×NVIDIA 3070显卡
模型使用示例
import torch
from transformers import(
AutoModelForQuestionAnswering,
AutoTokenizer,
pipeline
)
model_name = "sjrhuschlee/flan-t5-base-squad2"
nlp = pipeline(
'question-answering',
model=model_name,
tokenizer=model_name,
)
qa_input = {
'question': f'{nlp.tokenizer.cls_token}Where do I live?',
'context': 'My name is Sarah and I live in London'
}
res = nlp(qa_input)
model = AutoModelForQuestionAnswering.from_pretrained(
model_name,
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
question = f'{tokenizer.cls_token}Where do I live?'
context = 'My name is Sarah and I live in London'
encoding = tokenizer(question, context, return_tensors="pt")
output = model(
encoding["input_ids"],
attention_mask=encoding["attention_mask"]
)
all_tokens = tokenizer.convert_ids_to_tokens(encoding["input_ids"][0].tolist())
answer_tokens = all_tokens[torch.argmax(output["start_logits"]):torch.argmax(output["end_logits"]) + 1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))
性能指标
{
"eval_HasAns_exact": 79.97638326585695,
"eval_HasAns_f1": 86.1444296592862,
"eval_HasAns_total": 5928,
"eval_NoAns_exact": 84.42388561816652,
"eval_NoAns_f1": 84.42388561816652,
"eval_NoAns_total": 5945,
"eval_best_exact": 82.2033184536343,
"eval_best_exact_thresh": 0.0,
"eval_best_f1": 85.28292588395921,
"eval_best_f1_thresh": 0.0,
"eval_exact": 82.2033184536343,
"eval_f1": 85.28292588395928,
"eval_runtime": 522.0299,
"eval_samples": 12001,
"eval_samples_per_second": 22.989,
"eval_steps_per_second": 0.96,
"eval_total": 11873
}
{
"eval_exact_match": 86.3197729422895,
"eval_f1": 92.94686836210295,
"eval_runtime": 442.1088,
"eval_samples": 10657,
"eval_samples_per_second": 24.105,
"eval_steps_per_second": 1.007
}
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 2e-05
- 训练批大小: 16
- 评估批大小: 8
- 随机种子: 42
- 梯度累积步数: 6
- 总训练批大小: 96
- 优化器: Adam (beta1=0.9, beta2=0.999, epsilon=1e-08)
- 学习率调度器类型: linear
- 学习率预热比例: 0.1
- 训练轮数: 4.0
训练结果
(此处内容为空)
框架版本
- Transformers 4.30.0.dev0
- PyTorch 2.0.1+cu117
- Datasets 2.12.0
- Tokenizers 0.13.3