M

Mlong T5 Large Sumstew

由 Joemgu 开发
这是一个支持多语言、长文本(最高支持16k输入标记)的抽象摘要生成模型。基于sumstew数据集训练,可为给定输入文档生成标题和摘要。
下载量 103
发布时间 : 6/11/2023
模型介绍
内容详情
替代品

模型简介

该模型基于T5架构,专门用于多语言文本摘要生成任务,特别擅长处理长文本输入(最高16k标记)。支持英语、德语、法语、意大利语和西班牙语五种语言,能够同时生成标题和摘要。

模型特点

多语言支持
支持英语、德语、法语、意大利语和西班牙语五种语言的摘要生成
长文本处理能力
最高支持16k输入标记,适合处理长文档摘要任务
标题+摘要联合生成
可同时生成文档标题和摘要,输出格式灵活
预训练+微调架构
基于T5架构,在sumstew数据集上进行了专门微调

模型能力

文本摘要生成
标题生成
多语言文本处理
长文本理解

使用案例

内容摘要
新闻文章摘要
自动生成新闻文章的关键摘要
ROUGE-1得分29.7108(在samsum测试集上)
学术论文摘要
为长篇幅学术论文生成简明摘要
内容管理
文档标题生成
自动为文档生成有意义的标题