P

Pegasus Arxiv

由 google 开发
PEGASUS是基于间隙句子提取的预训练抽象摘要模型,通过混合与随机化策略优化摘要生成效果
下载量 333
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

一种基于Transformer的预训练模型,专门用于文本摘要任务,通过间隙句子预测目标进行预训练

模型特点

混合与随机化训练
同时基于C4和HugeNews数据集训练,采用随机采样间隔句子比例和重要性分数噪声扰动
动态间隔句子采样
训练时动态采样15%-45%的间隔句子比例,增强模型泛化能力
改进分词器
升级SentencePiece分词器支持换行符编码,保留段落结构信息
长时训练
训练步数扩展至150万步,确保模型充分收敛

模型能力

文本摘要生成
多领域摘要适应
抽象式摘要

使用案例

新闻摘要
CNN/DailyMail新闻摘要
为新闻文章生成简洁摘要
ROUGE-1/2/L: 44.16/21.56/41.30
学术论文摘要
arXiv论文摘要
生成学术论文的技术摘要
ROUGE-1/2/L: 44.21/16.95/25.67
法律文档处理
法案摘要
为法律法案生成执行摘要
ROUGE-1/2/L: 59.67/41.58/47.59