语言: 葡萄牙语
许可证: MIT
标签:
- t5
- pytorch
- pt
- pt-br
- 摘要生成
- 抽象摘要生成
推理参数:
最小长度: 32
最大长度: 256
前k个词: 5
示例:
- 文本: '使用干刷去角质可以促进血液循环并保持皮肤健康。建议通过去角质来遮盖已形成的妊娠纹,同时也可作为预防技术。选择天然纤维制成的干刷,刷毛需结实但不过硬。从腿部最低处开始向上刷至心脏方向,重点刷可能产生妊娠纹的部位如腹部和臀部。完成后冲洗去除死皮细胞,注意避免用干刷刷胸部敏感区域。许多市售沐浴露含硫酸盐,长期使用会导致皮肤干燥失去弹性,建议选用含天然油脂的清洁产品。椰子油可作为健康皮肤清洁剂,温水冲洗后轻柔擦干。若皮肤易干燥,可仅用温水清洗。保湿对预防妊娠纹至关重要,需在腹部、侧腰、背部、大腿等易长纹处涂抹专为孕妇设计的产品或天然油(如生物油、可可脂、杏仁油、乳木果油、小麦胚芽油)。纯羊毛脂(源自绵羊羊毛弹性维持油脂)同样有效。建议早晚各保湿一次,若皮肤拉伸处发痒需加强保湿。游泳或日晒时务必在腹部、侧腰、胸部等部位涂抹高倍防晒霜,孕期尤其需注重防晒防护。'
示例标题: "文本1"
葡萄牙语T5抽象摘要模型(PTT5 Summ)
简介
PTT5 Summ是基于PTT5微调的巴西葡萄牙语文本抽象摘要生成模型,训练数据集包括:RecognaSumm、WikiLingua、XL-Sum、TeMário和CSTNews。
更多信息请访问PTT5 Summ仓库。
可用模型
使用示例
from transformers import T5Tokenizer
from transformers import T5Model, T5ForConditionalGeneration
token_name = 'unicamp-dl/ptt5-base-portuguese-vocab'
model_name = 'phpaiola/ptt5-base-summ-xlsum'
tokenizer = T5Tokenizer.from_pretrained(token_name)
model_pt = T5ForConditionalGeneration.from_pretrained(model_name)
text = '''
巴西央行行长梅雷莱斯表示:"巴西利率下降趋势真实可见"。他在华盛顿参加国际货币基金组织和世界银行会议期间会见了银行家和投资者。
央行行长认为,政府当前经济政策和通胀率维持在目标区间内是确保长期利率下降的关键因素。
他强调需关注中长期趋势,央行控制通胀的工作将促使利率逐步下降。
周日梅雷莱斯出席《银行家》杂志颁发的"年度央行"颁奖仪式,称这是对巴西经济方向的重要认可。
他表示市场已开始认真看待巴西的通胀目标承诺,并指出周末会谈中投资者对巴西政治危机关注度不高。
'''
inputs = tokenizer.encode(text, max_length=512, truncation=True, return_tensors='pt')
summary_ids = model_pt.generate(inputs, max_length=256, min_length=32, num_beams=5, no_repeat_ngram_size=3, early_stopping=True)
summary = tokenizer.decode(summary_ids[0])
print(summary)
引用文献
@InProceedings{ptt5summ_bracis,
author="Paiola, Pedro H.
and de Rosa, Gustavo H.
and Papa, João P.",
editor="Xavier-Junior, João Carlos
and Rios, Ricardo Araújo",
title="基于深度学习的巴西葡萄牙语文本抽象摘要生成",
booktitle="BRACIS 2022: 智能系统",
year="2022",
publisher="Springer International Publishing",
address="Cham",
pages="479--493",
isbn="978-3-031-21689-3"}