L

Long T5 Tglobal Xl 16384 Book Summary

由 pszemraj 开发
基于BookSum数据集微调的LongT5-XL模型,专为长文本摘要设计,能生成类似SparkNotes的摘要。
下载量 58
发布时间 : 11/27/2022
模型介绍
内容详情
替代品

模型简介

该模型在kmfoda/booksum数据集上微调,擅长处理学术和叙述性文本,能生成高质量的摘要内容。

模型特点

长文本处理能力
支持最长16384个token的输入文本,适合处理书籍章节等长文档。
高质量摘要
从人类评估角度看,XL检查点能生成更好的摘要内容。
多领域适用性
对学术和叙述性文本都有较好的泛化能力。
LLM.int8量化支持
支持8位量化,显著减少内存使用同时保持摘要质量。

模型能力

长文本摘要
书籍章节总结
学术论文摘要
法律文档摘要

使用案例

教育
书籍摘要生成
为学生生成类似SparkNotes的书籍章节摘要
生成易于理解的章节概述
研究
学术论文摘要
为研究人员生成长篇论文的简明摘要
ROUGE-1得分36.2043(multi_news数据集)
法律
法律文档摘要
总结冗长的法律文件
ROUGE-1得分41.3645(billsum数据集)