R

Randeng Pegasus 523M Chinese

由 IDEA-CCNL 开发
专精于文本摘要任务的中文版PAGASUS-large模型,基于PEGASUS架构训练,针对中文分词进行优化。
下载量 329
发布时间 : 6/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于PEGASUS架构的中文文本摘要模型,经过180G悟道语料库预训练,融合结巴分词与BERT分词器解决中文分词稳定性问题。

模型特点

中文优化
针对中文分词的稳定性问题,创新性地融合了结巴分词与BERT分词器。
大规模预训练
采用180G版悟道语料库作为预训练数据,提升模型性能。
多版本支持
提供基础版模型和中文摘要数据集微调版,满足不同需求。

模型能力

文本摘要生成
中文文本处理

使用案例

新闻摘要
新闻内容摘要
对长篇新闻文章生成简洁摘要,提取关键信息。
生成符合原文核心内容的简短摘要。
文档处理
长文档摘要
对技术文档、报告等长文本生成摘要。
提取文档核心内容,生成简洁摘要。