B

Bigbird Pegasus Large Arxiv

由 google 开发
BigBird是一种基于稀疏注意力的Transformer模型,能够处理更长的序列,适用于长文档摘要等任务。
下载量 8,528
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BigBirdPegasus是基于稀疏注意力的Transformer模型,扩展了传统Transformer的能力,特别适合处理长序列任务,如科学论文摘要生成。

模型特点

稀疏注意力机制
采用块稀疏注意力机制,能够高效处理长达4096的序列,计算成本低于传统注意力机制。
长序列处理能力
特别适合处理超长序列任务,如长文档摘要和长上下文问答。
多任务适应
在多种摘要生成任务上表现良好,包括科学论文和新闻摘要。

模型能力

科学论文摘要生成
长文档摘要生成
长上下文问答

使用案例

学术研究
科学论文摘要生成
为科学论文生成简洁准确的摘要。
在arxiv数据集上ROUGE-1得分43.4702。
新闻媒体
新闻摘要生成
为新闻文章生成摘要。
在cnn_dailymail数据集上ROUGE-1得分9.0885。