B

Bigbird Base Trivia Itc

由 google 开发
基于bigbird-roberta-base的微调模型,专为trivia问答任务优化,支持长序列处理。
下载量 1,049
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于BigBird架构的问答模型,通过在trivia_qa数据集上微调而成,特别适合处理需要长上下文理解的问答任务。

模型特点

长序列处理能力
支持最大4096的序列长度,适合处理长文本问答任务。
灵活的注意力机制
支持block_sparse和original_full两种注意力模式,可根据需求调整。
高效计算
通过随机token和窗口化注意力机制实现高效计算。

模型能力

文本问答
长文本理解
事实检索

使用案例

知识问答
百科知识问答
回答基于百科知识的各类问题
在trivia_qa数据集上表现良好
事实核查
从长文本中提取事实信息进行验证