t5-base-finetuned-question-generation-ap开源模型 - 免费部署助力高效问题生成

首页

T5 Base Finetuned Question Generation Ap

由 mrm8488 开发

该模型是基于T5-base架构，在SQuAD v1.1数据集上微调，专门用于问题生成任务。

问答系统

Transformers

英语开源协议:Apache-2.0 #问答生成 #SQuAD微调 #文本到文本转换

下载量 6,562

发布时间 : 3/2/2022

模型简介

该模型能够根据给定的答案和上下文生成相关问题，适用于问答系统的构建和知识库增强。

模型特点

基于答案的问题生成

只需提供答案和上下文，即可自动生成相关的问题。

SQuAD数据集微调

在高质量的SQuAD问答数据集上进行微调，确保生成问题的准确性。

简单易用

提供简洁的API接口，只需几行代码即可实现问题生成功能。

模型能力

文本生成

问题生成

问答系统支持

使用案例

教育

自动生成测验问题

根据教材内容自动生成测验问题

提高教师工作效率，快速创建测验内容

知识管理

知识库增强

为现有知识库生成相关问题

改善知识库的搜索和检索能力

🚀 T5-base在SQuAD上微调用于问题生成

本项目基于Google的T5模型，在SQuAD v1.1数据集上进行微调，用于问题生成。方法是将答案前置到上下文之前。

📚 T5模型详情

T5模型由Colin Raffel、Noam Shazeer、Adam Roberts、Katherine Lee、Sharan Narang、Michael Matena、Yanqi Zhou、Wei Li、Peter J. Liu在论文Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer中提出，以下是论文摘要：

迁移学习是自然语言处理（NLP）中的一种强大技术，即先在数据丰富的任务上预训练模型，再在下游任务上进行微调。迁移学习的有效性催生了多种方法、方法论和实践。在本文中，我们通过引入一个统一框架，将每个语言问题转化为文本到文本的格式，探索了NLP迁移学习技术的领域。我们的系统研究比较了数十个语言理解任务中的预训练目标、架构、无标签数据集、迁移方法和其他因素。通过将我们的探索见解与大规模数据以及新的“Colossal Clean Crawled Corpus”相结合，我们在许多涵盖摘要、问答、文本分类等的基准测试中取得了最先进的结果。为了促进未来NLP迁移学习的研究，我们发布了数据集、预训练模型和代码。

模型图片

📚 下游任务（问答）详情 - 数据集

数据集ID：squad，来自 Huggingface/NLP

数据集	划分	样本数量
squad	训练集	87599
squad	验证集	10570

如何从 nlp 加载该数据集：

train_dataset  = nlp.load_dataset('squad', split=nlp.Split.TRAIN)
valid_dataset = nlp.load_dataset('squad', split=nlp.Split.VALIDATION)

在 NLP Viewer 中查看该数据集和其他数据集的更多信息。

🏋️‍ 模型微调

训练脚本是 Suraj Patil 的这个优秀脚本的轻微修改版本。

他还在 问题生成 方面做了很棒的研究。

🚀 模型实战

# 提示：目前请从源代码安装transformers

from transformers import AutoModelWithLMHead, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("mrm8488/t5-base-finetuned-question-generation-ap")
model = AutoModelWithLMHead.from_pretrained("mrm8488/t5-base-finetuned-question-generation-ap")

def get_question(answer, context, max_length=64):
  input_text = "answer: %s  context: %s </s>" % (answer, context)
  features = tokenizer([input_text], return_tensors='pt')

  output = model.generate(input_ids=features['input_ids'], 
               attention_mask=features['attention_mask'],
               max_length=max_length)

  return tokenizer.decode(output[0])

context = "Manuel has created RuPERTa-base with the support of HF-Transformers and Google"
answer = "Manuel"

get_question(answer, context)

# 输出: question: Who created the RuPERTa-base?

📄 引用

如果您想引用此模型，可以使用以下内容：

@misc{mromero2021t5-base-finetuned-question-generation-ap,
  title={T5 (base) fine-tuned on SQUAD for QG via AP},
  author={Romero, Manuel},
  publisher={Hugging Face},
  journal={Hugging Face Hub},
  howpublished={\url{https://huggingface.co/mrm8488/t5-base-finetuned-question-generation-ap}},
  year={2021}
}