L

Lsg Bart Base 16384 Mediasum

由 ccdv 开发
基于LSG技术的BART模型,专为处理长序列摘要生成任务优化,支持16384长度的输入序列
下载量 22
发布时间 : 6/23/2022
模型介绍
内容详情
替代品

模型简介

该模型采用局部-稀疏-全局注意力机制,在MediaSum数据集上微调,适用于长文本摘要生成任务

模型特点

长序列处理能力
支持处理长达16384个token的输入序列,适合长文档摘要任务
混合注意力机制
结合局部、稀疏和全局注意力,有效捕捉长距离依赖关系
高效微调
在1个epoch内完成微调,保持高性能的同时节省计算资源

模型能力

长文本摘要生成
文本压缩
关键信息提取

使用案例

媒体内容处理
新闻文章摘要
自动生成新闻文章的核心内容摘要
Rouge-L得分31.81
访谈记录总结
从长篇访谈记录中提取关键对话要点
Rouge-1得分35.31