L

Led Base 16384 Billsum Summarization

由 AlgorithmicResearchGroup 开发
该模型是在billsum数据集上对led-base-16384进行微调的版本,专门用于长文档摘要生成任务。
下载量 15
发布时间 : 11/26/2022
模型介绍
内容详情
替代品

模型简介

基于LED架构的文本摘要模型,针对法律条文等长文档进行优化,支持处理长达16K的文本输入。

模型特点

超长文本处理
支持处理长达16,384个token的长文档,通过复制位置嵌入矩阵实现。
法律文本优化
在billsum数据集上微调,特别适合法律条文等正式文档的摘要生成。
高效编码解码
采用LED架构,结合了Longformer的编码能力和BART的解码能力。

模型能力

长文档摘要生成
法律文本处理
结构化信息提取

使用案例

法律文档处理
法律条文摘要
自动生成冗长法律条文的简洁摘要
ROUGE-1得分47.672
法案内容提炼
从复杂法案中提取关键条款和修改内容
ROUGE-L得分34.568
政府文档处理
政策文件摘要
为政府政策文件生成执行摘要