qnli-distilroberta-base开源模型 - 快速判断段落能否回答特定问题！

首页

Qnli Distilroberta Base

由 cross-encoder 开发

该模型是基于distilroberta-base训练的交叉编码器，用于判断给定段落是否能回答特定问题，在GLUE QNLI数据集上训练。

问答系统英语开源协议:Apache-2.0 #问答匹配 #文本推理 #SQuAD优化

下载量 1,526

发布时间 : 3/2/2022

模型简介

该模型是一个基于DistilRoBERTa-base的交叉编码器，专门用于问答对匹配任务，判断给定段落是否能回答特定问题。

模型特点

高效问答匹配

能够准确判断给定段落是否能回答特定问题

基于DistilRoBERTa

使用轻量级但高效的DistilRoBERTa-base模型架构

交叉编码架构

采用交叉编码器设计，能够同时处理问题和段落的关系

模型能力

问答对匹配

文本相关性判断

自然语言推理

使用案例

问答系统

自动问答验证

验证候选答案段落是否能正确回答问题

可提供0-1之间的相关性评分

信息检索

搜索结果排序

对搜索引擎返回的结果进行相关性排序

提高搜索结果的相关性

🚀 用于SQuAD（QNLI）的交叉编码器

该模型使用 SentenceTransformers 的 Cross-Encoder 类进行训练，可有效解决文本排序相关问题。

🚀 快速开始

本模型基于 distilbert/distilroberta-base 基础模型，使用 sentence-transformers 库进行开发，适用于文本排序任务。

✨ 主要特性

基于 SentenceTransformers 库的 Cross-Encoder 类训练，在文本排序任务上表现出色。
模型在 GLUE QNLI 数据集上进行训练，该数据集将 SQuAD 数据集转换为自然语言推理（NLI）任务。

📦 安装指南

文档未提及具体安装步骤，若需使用 sentence-transformers 库，可使用以下命令安装：

pip install sentence-transformers

💻 使用示例

基础用法

from sentence_transformers import CrossEncoder

model = CrossEncoder('cross-encoder/qnli-distilroberta-base')
scores = model.predict([('Query1', 'Paragraph1'), ('Query2', 'Paragraph2')])

#e.g.
scores = model.predict([('How many people live in Berlin?', 'Berlin had a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.'), ('What is the size of New York?', 'New York City is famous for the Metropolitan Museum of Art.')])

高级用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/qnli-distilroberta-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/qnli-distilroberta-base')

features = tokenizer(['How many people live in Berlin?', 'What is the size of New York?'], ['Berlin had a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.', 'New York City is famous for the Metropolitan Museum of Art.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = torch.nn.functional.sigmoid(model(**features).logits)
    print(scores)

📚 详细文档

训练数据：给定一个问题和一个段落，判断该问题是否可以由该段落回答。模型在 GLUE QNLI 数据集上进行训练，该数据集将 SQuAD 数据集转换为自然语言推理（NLI）任务。
性能表现：关于该模型的性能结果，请参考 SBERT.net 预训练交叉编码器。

📄 许可证

本项目采用 Apache-2.0 许可证。

属性	详情
基础模型	distilbert/distilroberta-base
模型类型	用于SQuAD（QNLI）的交叉编码器
训练数据	GLUE QNLI 数据集，将 SQuAD 数据集转换为 NLI 任务
库名称	sentence-transformers
标签	transformers