L

Lsg Bart Base 4096 Wcep

由 ccdv 开发
基于LSG-BART架构的长文本摘要生成模型,在WCEP-10数据集上微调,支持4096个token的长序列处理
下载量 27
发布时间 : 5/25/2022
模型介绍
内容详情
替代品

模型简介

该模型采用局部-稀疏-全局注意力机制处理长序列,适用于长文本摘要生成任务。基于BART-base架构改造,支持高效处理长文档。

模型特点

长序列处理能力
支持4096个token的长文本处理,通过局部-稀疏-全局注意力机制实现高效计算
多种稀疏注意力模式
提供局部、池化、跨步、块跨步、归一化和LSH等多种稀疏注意力配置选项
资源效率优化
支持通过调整块大小和稀疏度来平衡性能和资源消耗

模型能力

长文本摘要生成
多文档摘要生成
英语文本处理

使用案例

文本摘要
新闻文章摘要
为长新闻文章生成简洁摘要
在WCEP-10测试集上ROUGE-1得分达46.02
研究报告浓缩
从长篇研究报告中提取关键信息
支持4096 token的长文档处理能力