L

Lsg Bart Base 4096 Multinews

由 ccdv 开发
基于LSG技术的BART-base模型,专为长文本摘要任务设计,支持4096长度的输入序列
下载量 26
发布时间 : 5/25/2022
模型介绍
内容详情
替代品

模型简介

该模型采用局部-稀疏-全局注意力机制处理长序列,在multi_news数据集上微调,适用于多文档摘要生成任务

模型特点

长序列处理能力
支持最长4096 tokens的输入序列,采用局部-稀疏-全局注意力机制高效处理长文本
多文档摘要优化
在multi_news数据集上微调,专门针对多文档摘要场景优化
灵活注意力配置
支持多种稀疏注意力模式(池化/跨步/块跨步/归一化/LSH),可根据需求平衡性能与资源消耗

模型能力

长文本摘要生成
多文档信息整合
英文文本处理

使用案例

新闻摘要
多源新闻摘要
从多个相关新闻文章中生成统一摘要
在multi_news测试集上达到R1 47.10/R2 18.94/RL 25.22
文档整理
长文档摘要
对技术文档、研究报告等长文本生成精简摘要