语言: 葡萄牙语
许可证: MIT
标签:
- t5
- pytorch
- 葡萄牙语
- 巴西葡萄牙语
- 摘要生成
- 抽象摘要生成
推理参数:
最小长度: 32
最大长度: 256
前k候选: 5
示例:
- 文本: '男子威尔默·安东尼奥·马林,化名雨果,据称是哥伦比亚革命武装力量(Farc)的高级指挥官,这是该国最大的反叛组织。他被指控在二月对一家夜总会发动袭击,造成35人死亡,160人受伤。雨果还涉嫌参与日本商人村松千贺夫的谋杀案,后者在被绑架近三年后于十一月被发现中枪身亡。哥伦比亚当局认为,雨果被捕是对波哥大Farc组织结构的重大打击。威尔默·安东尼奥·马林被指控管理一个绑架网络,目标是富有的商人和外国人。他负责在街头绑架他们并将其带到游击队基地所在的山区。'
示例标题: "新闻1"
- 文本: '圣路易斯司法拘留中心(CCPJ)的囚犯叛乱于本周三(17日)下午早些时候结束。囚犯们交出了武器,警方正在单位内进行搜查。骚乱始于周二(16日)举行的儿童节庆祝活动期间。16名儿童和14名成人被释放。据警方消息,叛乱首领已被转移到马拉尼昂州首府的佩德林哈斯监狱。囚犯们得到了单位主管的保证,不会遭到报复或新的转移。囚犯们试图在庆祝活动期间逃跑,但计划被发现。叛乱初期有四人受伤,其中包括一名护士助理和一名在监狱工作的警察。该单位一度断电断水,人质释放的谈判于本周三上午恢复。据警方称,囚犯们担心在上周警察罢工期间发动另一次叛乱后会遭到大规模转移。CCPJ的容量约为80名囚犯,但目前关押了203名男性。'
示例标题: "新闻2"
葡萄牙语T5抽象摘要模型(PTT5 Summ)
简介
PTT5 Summ是基于PTT5微调的模型,用于生成巴西葡萄牙语文本的抽象摘要。该模型在以下数据集上进行了微调:RecognaSumm、WikiLingua、XL-Sum、TeMário和CSTNews。
更多信息,请访问PTT5 Summ仓库。
可用模型
使用示例
from transformers import T5Tokenizer
from transformers import T5Model, T5ForConditionalGeneration
token_name = 'unicamp-dl/ptt5-base-portuguese-vocab'
model_name = 'phpaiola/ptt5-base-summ-xlsum'
tokenizer = T5Tokenizer.from_pretrained(token_name)
model_pt = T5ForConditionalGeneration.from_pretrained(model_name)
text = '''
“巴西利率下降的趋势是真实的,是显而易见的,”梅雷莱斯在参加美国首都一系列与银行家和投资者的会议时表示,这些会议与国际货币基金组织(IMF)和世界银行(Bird)的周末会议同期举行。
巴西央行行长认为,政府当前的经济政策和将通胀率维持在目标范围内的措施是确保长期利率下降的因素。
“但重要的是我们不要只关注短期。我们必须关注中期和长期,”梅雷莱斯说。
对他来说,巴西央行为将通胀控制在目标范围内所做的工作将逐步降低利率。
年度央行
本周日,梅雷莱斯参加了《银行家》杂志颁发的“年度央行”奖项的颁奖仪式。
“这是对我们工作的重要认可信号,表明巴西正走在正确的方向上,”他说。
据梅雷莱斯称,巴西央行被认为是一个致力于通胀目标的机构。
“这带来了重要的收益,因为价格制定者开始相信通胀将保持在目标范围内,这在巴西是被认真对待的,”他补充道。
巴西央行行长还表示,他在周末会见的投资者对巴西政治危机并不太感兴趣。
'''
inputs = tokenizer.encode(text, max_length=512, truncation=True, return_tensors='pt')
summary_ids = model_pt.generate(inputs, max_length=256, min_length=32, num_beams=5, no_repeat_ngram_size=3, early_stopping=True)
summary = tokenizer.decode(summary_ids[0])
print(summary)
引用
@InProceedings{ptt5summ_bracis,
author="Paiola, Pedro H.
and de Rosa, Gustavo H.
and Papa, João P.",
editor="Xavier-Junior, João Carlos
and Rios, Ricardo Araújo",
title="基于深度学习的巴西葡萄牙语文本抽象摘要生成",
booktitle="BRACIS 2022: 智能系统",
year="2022",
publisher="Springer International Publishing",
address="Cham",
pages="479--493",
isbn="978-3-031-21689-3"}