L

Lsg Bart Base 4096 Pubmed

由 ccdv 开发
基于LSG注意力机制的长序列处理模型,专为科学论文摘要生成任务微调
下载量 21
发布时间 : 5/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是BART-base的改进版本,采用局部-稀疏-全局注意力机制处理长序列输入,在PubMed科学论文数据集上微调,适用于长文本摘要生成任务。

模型特点

长序列处理能力
支持最长4096 tokens的输入序列,采用局部-稀疏-全局注意力机制高效处理长文本
多种注意力模式
提供局部、池化、跨步、块跨步、归一化和LSH等多种稀疏注意力模式选择
科学论文优化
在PubMed科学论文数据集上专门微调,适合学术文本摘要生成

模型能力

长文本处理
科学论文摘要生成
序列到序列转换

使用案例

学术研究
科学论文自动摘要
为长篇科研论文生成简洁准确的摘要
在PubMed测试集上ROUGE-1得分47.37
文献处理
医学文献摘要
处理医学领域的长篇研究文献,提取关键信息