许可证:apache-2.0
基础模型:google-t5/t5-small
标签:
- 训练生成
- 摘要生成
- 文本转文本
评估指标:
- rouge
模型索引:
- 名称:flan-t5-small-summarization
结果:[]
推理参数:
最大新令牌数:128
管道标签:摘要生成
数据集:
- recogna-nlp/recognasumm
语言:
- 葡萄牙语
库名称:transformers
示例:
- 文本:"sumarize: Na segunda disputa estadual para escolher o candidato do partido republicano para as eleições de novembro nos Estados Unidos, o ex-presidente Donald Trump teve mais uma vitória. Ele venceu as primárias em New Hampshire, que ocorreram na terça-feira (23/01). Antes disso, o favoritismo de Trump, apontado por diversas pesquisas, foi visto em sua vitória na primeira prévia do calendário eleitoral americano, em Iowa. Naquele Estado, Trump registrou 51% dos votos e vantagem de 30 pontos sobre o segundo colocado, o governador da Flórida, Ron DeSantis. No domingo (21/1), DeSantis anunciou sua desistência da corrida presidencial de 2024 e manifestou apoio a Trump. O movimento deixou Nikki Haley, ex-embaixadora dos Estados Unidos nas Nações Unidas, como a única rival significativa de Trump no partido."
示例标题:"摘要1"
- 文本:"sumarize: No que consiste o transtorno dismórfico corporal? São pessoas que se acham feias e querem mudar sua aparência de forma obsessiva, mesmo que não tenham nenhum problema. Num dos estudos que fiz, detectamos que de 50% a 54% dos pacientes que procuram cirurgia de face, nariz ou abdômen apresentam essa condição. A cirurgia pode beneficiar aqueles com um quadro leve ou intermediário do transtorno. No entanto, os que apresentam um transtorno mais grave não devem ser operados, e sim encaminhados para tratamento psicológico. A maior dificuldade é que aceitem ajuda. Muitos preferem buscar um médico que dê sinal verde para a intervenção."
示例标题:"摘要2"
t5-葡萄牙语小模型摘要生成
模型描述
该模型旨在满足葡萄牙语任务对模型的需求,尤其在摘要生成任务上表现良好。由于是小版本模型,偶尔可能出现因单词重音导致的错误。
模型最大长度 = 512
使用t5-葡萄牙语小模型摘要生成的示例1:
特朗普赢得新罕布什尔州周二(23/01)举行的初选。
此前,多项民调显示的特朗普优势在爱荷华州初选中得到印证,他以51%得票率领先第二名佛罗里达州州长罗恩·德桑蒂斯30个百分点。
原始t5-small生成结果:
此举使美国前驻联合国大使尼基·黑利成为特朗普党内唯一重要对手。
该模型是基于google-t5/t5-small微调的版本:
- 损失值:1.8997
- Rouge1:15.0817
- Rouge2:5.3292
- RougeL:12.958
- RougeLsum:13.8768
- 生成长度:18.968
GPU配置:RTX 3060,12GB显存,约3500个CUDA核心
使用方法
!pip install transformers
from transformers import pipeline
summarization = pipeline("summarization", model="rhaymison/t5-portuguese-small-summarization", tokenizer="rhaymison/t5-portuguese-small-summarization")
prompt =f"""
sumarize: Na segunda disputa estadual... [原文内容]
"""
output = summarization(prompt)
训练超参数
- 学习率:2e-05
- 训练批次大小:6
- 评估批次大小:6
- 随机种子:42
- 梯度累积步数:4
- 总训练批次大小:24
- 优化器:Adam(beta1=0.9,beta2=0.999,epsilon=1e-08)
- 学习率调度器类型:线性
- 训练轮次:25
- 混合精度训练:原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
Rouge1 |
Rouge2 |
RougeL |
RougeLsum |
生成长度 |
2.092 |
0.6 |
500 |
1.9551 |
14.6613 |
5.2159 |
12.5685 |
13.4544 |
18.968 |
...(后续数据表格保持原格式)... |
|
|
|
|
|
|
|
|
框架版本
- Transformers 4.38.2
- PyTorch 2.2.1+cu121
- Datasets 2.18.0
- Tokenizers 0.15.2
联系方式
欢迎任何建议、帮助或问题反馈。
邮箱:rhaymisoncristian@gmail.com