P

Pegasus Indonesian Base Finetune

由 thonyyy 开发
该模型是基于PEGASUS架构的印尼语文本摘要模型,在Indosum、Liputan6和XLSum数据集上微调而成,适用于新闻类文本摘要任务。
下载量 172
发布时间 : 6/27/2023
模型介绍
内容详情
替代品

模型简介

这是一个针对印尼语文本的自动摘要生成模型,特别优化了新闻类文本的处理能力,能够从长篇文章中提取关键信息生成简洁摘要。

模型特点

多数据集微调
在Indosum、Liputan6和XLSum三个印尼语数据集上进行微调,增强了模型泛化能力
文本预处理集成
内置文本清洗功能,可自动处理链接、特殊字符等干扰因素
TPU优化训练
使用Google TPU研究云进行训练,确保高效训练过程

模型能力

印尼语文本摘要
新闻内容提炼
长文本压缩

使用案例

新闻媒体
新闻摘要生成
自动为新闻文章生成简洁摘要
在Indosum数据集上ROUGE-1达到52.43
内容分析
报告关键信息提取
从长篇报告中提取核心内容