L

Lsg Bart Base 4096 Mediasum

由 ccdv 开发
基于LSG技术的BART-base模型,针对长文本摘要任务在MediaSum数据集上微调,支持4096长度的序列处理
下载量 44
发布时间 : 5/29/2022
模型介绍
内容详情
替代品

模型简介

该模型采用局部-稀疏-全局注意力机制处理长序列,适用于长文本摘要生成任务。基于BART-base架构改造,在MediaSum对话摘要数据集上微调。

模型特点

长序列处理能力
支持最长4096 token的序列输入,通过局部-稀疏-全局注意力机制高效处理长文本
多模式稀疏注意力
提供局部/池化/跨步/块跨步/归一化/LSH等多种稀疏注意力模式选择
资源效率优化
支持调整块大小(32-256)平衡性能与资源消耗,适应不同硬件条件

模型能力

长文本摘要生成
对话内容摘要
多轮对话理解

使用案例

媒体内容处理
访谈摘要生成
将长篇媒体访谈内容压缩为简洁摘要
在MediaSum测试集上达到R1=35.16/R2=18.13/RL=31.54
会议记录处理
会议纪要自动生成
从长时间会议录音转写文本中提取关键要点