led-base-book-summary开源文本摘要模型 - 免费处理长文，生成技术学术叙事摘要

首页

Led Base Book Summary

由 pszemraj 开发

一个基于LED架构的文本摘要模型，专门用于处理技术性、学术性和叙事性长文本的摘要生成。

文本生成

Transformers

其他开源协议:Bsd-3-clause #长文档摘要 #学术文本处理 #BookSum微调

下载量 13.10k

发布时间 : 3/2/2022

模型简介

该模型是从allenai/led-base-16384微调而来，擅长处理长篇叙述、论文、教材等文档摘要，生成类似'学习指南'风格的说明性摘要内容。

模型特点

长文本处理能力

支持单批次处理16,384个token，适合处理长篇文档

学术性内容摘要

特别适合技术论文、教材等学术内容的摘要生成

学习指南风格摘要

生成的摘要具有说明性特点，类似学习指南风格

多模型支持

提供多种变体模型选择，满足不同质量需求

模型能力

长文本摘要生成

技术文档摘要

学术论文摘要

教材内容摘要

叙事性文本摘要

使用案例

学术研究

科研论文摘要

为长篇科研论文生成简明摘要

生成类似学习指南风格的摘要

教材内容摘要

为教材章节生成关键点摘要

帮助学生快速掌握章节要点

内容创作

博客文章摘要

为长篇博客文章生成摘要

提取文章核心观点

🚀 长文本摘要模型

本项目聚焦于长文本摘要领域，旨在解决传统基于Transformer模型在处理长序列时计算成本过高的问题。通过引入如BigBird等模型，能够以更低的计算成本处理更长的序列，在长文本摘要、长上下文问答等任务中取得了优异的成绩。同时，项目还提供了BookSum数据集，为长文本叙事摘要系统带来了新的挑战和机遇。

🚀 快速开始

你可以直接使用提供的模型进行推理，推理参数设置如下：

{
    "max_length": 96,
    "min_length": 8,
    "no_repeat_ngram_size": 3,
    "early_stopping": true,
    "repetition_penalty": 3.5,
    "length_penalty": 0.3,
    "encoder_no_repeat_ngram_size": 3,
    "num_beams": 4
}

✨ 主要特性

处理长序列：能够处理长度达到4096的序列，相比传统模型有显著提升。
低计算成本：采用块稀疏注意力机制，降低了计算复杂度。
多任务表现优异：在长文本摘要、长上下文问答等任务中取得了SOTA成绩。
提供数据集：引入BookSum数据集，包含文学领域的长文档及不同粒度的摘要。

📦 安装指南

文档未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

文档未提供基础用法代码示例，故跳过此部分。

高级用法

文档未提供高级用法代码示例，故跳过此部分。

📚 详细文档

模型介绍

基于Transformer的模型在许多自然语言处理任务中表现出色，但处理长序列时存在 $O(n^2)$ 的时间和内存复杂度问题。BigBird模型通过块稀疏注意力机制解决了这一问题，能够以较低的计算成本处理长序列。

数据集介绍

BookSum是一个用于长文本叙事摘要的数据集，涵盖了小说、戏剧和故事等文学领域的源文档，并包含段落级、章节级和书籍级三个难度递增的粒度的高度抽象的人工编写摘要。

推理参数

推理时可设置以下参数：

属性	详情
max_length	生成摘要的最大长度
min_length	生成摘要的最小长度
no_repeat_ngram_size	避免重复的n-gram大小
early_stopping	是否提前停止生成
repetition_penalty	重复惩罚系数
length_penalty	长度惩罚系数
encoder_no_repeat_ngram_size	编码器避免重复的n-gram大小
num_beams	束搜索的束数

模型评估结果

数据集	ROUGE-1	ROUGE-2	ROUGE-L	ROUGE-LSUM	loss	gen_len
kmfoda/booksum	33.4536	5.2232	16.2044	29.9765	3.1985862255096436	191.9783
samsum	32	10.0781	23.6331	28.7831	2.903024673461914	60.7411
cnn_dailymail	30.5036	13.2558	19.0284	28.3404	3.9438512325286865	231.0935
billsum	36.8502	15.9147	待补充	待补充	待补充	待补充