语言: 西班牙语
标签:
- 摘要生成
- SageMaker
- mT5
- 西班牙语
许可证: Apache-2.0
数据集:
- MLSum - 西班牙语版
模型索引:
- 名称: mt5-small-mlsum
结果:
- 任务:
类型: 摘要生成
名称: 抽象摘要生成
数据集:
类型: MLSum
名称: MLSum-西班牙语版
参数: es
指标:
- 名称: ROUGE-1
类型: ROUGE-1
值: 26.0756
- 名称: ROUGE-2
类型: ROUGE-2
值: 8.4669
- 名称: ROUGE-L
类型: ROUGE-L
值: 20.8167
- 名称: ROUGE-Lsum
类型: ROUGE-Lsum
值: 21.0822
示例输入:
- 文本: "阿根廷人传统又便捷的甜点——巧克力蛋糕(chocotorta),在其诞生近40年后,被国际餐厅评论家评选为全球最佳甜点。Taste Atlas排行榜将这款由饼干、奶油奶酪和焦糖牛奶制成的标志性本土甜点列为榜首,领先于意大利开心果冰淇淋和德国苹果派。'这款无需烘烤的阿根廷甜点受意大利美食影响,灵感来自著名的意大利提拉米苏。它由三种阿根廷基本原料制成:巧克力饼干、焦糖牛奶和奶油奶酪',该网站向全球游客推荐尝试巧克力蛋糕。在投票中,它还超越了比利时华夫饼和匈牙利Zserbó蛋糕。在当地排名中紧随其后的是夹心饼干(alfajor),得分为4.2分,而蛋糕为4.7分。在'头号甜点'金标说明中,专家们还逐步教授了巧克力蛋糕的制作方法。'饼干用牛奶软化后,覆盖上奶油奶酪和焦糖牛奶的混合物。巧克力蛋糕的形状可以多样,饼干可以用巧克力牛奶、咖啡甚至咖啡利口酒浸泡',他们详细说明。最后,他们将这款甜点的创作归功于一场旨在推广其同名标志性饼干的'营销活动'。这款阿根廷生日派对必备的巧克力蛋糕,由该国最重要广告公司的创意人Marité Mabragaña于1982年发明。"
mt5-small-mlsum
该模型基于mT5-small架构,在MLSum西班牙语数据集上训练而成:https://paperswithcode.com/sota/abstractive-text-summarization-on-mlsum
超参数
{
"数据集配置": "es",
"数据集名称": "mlsum",
"执行评估": true,
"执行预测": true,
"执行训练": true,
"浮点16精度": true,
"最大目标长度": 64,
"模型路径": "google/mt5-small",
"训练轮次": 10,
"输出目录": "/opt/ml/checkpoints",
"评估批次大小": 4,
"训练批次大小": 4,
"生成式预测": true,
"SageMaker容器日志级别": 20,
"SageMaker程序": "run_summarization.py",
"保存策略": "按轮次",
"随机种子": 7,
"摘要列": "summary",
"文本列": "text"
}
使用方式
文章 = """(同上西班牙语原文)"""
from transformers import pipeline
摘要器 = pipeline("summarization", model="LeoCordoba/mt5-small-mlsum")
摘要器(文章, min_length=5, max_length=64)
结果示例:
[{'summary_text': 'Taste Atlas排行榜将这款由饼干、奶油奶酪和焦糖牛奶制成的标志性本土甜点列为榜首'}]
性能指标
指标 |
得分 |
验证集ROUGE-1 |
26.4352 |
验证集ROUGE-2 |
8.9293 |
验证集ROUGE-L |
21.2622 |
验证集ROUGE-Lsum |
21.5518 |
测试集ROUGE-1 |
26.0756 |
测试集ROUGE-2 |
8.4669 |
测试集ROUGE-L |
20.8167 |
测试集ROUGE-Lsum |
21.0822 |