语言:
- 英文
许可证: Apache-2.0
标签:
- 训练生成
- 摘要
数据集:
- samsum
评估指标:
- rouge
小部件:
- 文本: '奥利维亚: 嘿卡特,你还在开发那个餐厅业务吗?卡特: 嗨奥利维亚 卡特: 是的,我们想下个月推出 :) 奥利维亚: 下个月?这么快!恭喜 :) 卡特: 谢谢,我有点紧张,但我真心相信我们正在提供一些创新且需要的东西 奥利维亚: 我认为这是个很棒的概念,我相信你会做得很好!奥利维亚: 我目前参与市中心一家新餐厅 卡特: 哪一家?奥利维亚: 辣爽餐厅 卡特: 我听说过 :) 好吗?;) 奥利维亚: 我喜欢这家餐厅,也很喜欢在那里工作 卡特: 真为你高兴!奥利维亚: 问题是——你还在寻找餐厅加入你的折扣应用吗?卡特: 当然,但我觉得当面讨论会更好——你想见面吗?奥利维亚: 那太好了!'
示例标题: 对话1
- 文本: '查德: 埃尔顿·约翰是山羊 伊娃: 你说的山羊是什么意思?弗兰克: 史上最伟大 查德: 没错 伊娃: 啊...现在明白了 :P'
示例标题: 对话2
- 文本: '《惊世X战警》是漫威漫画推出的四个X战警漫画系列名称,前两个为限定系列。第三卷于2004年开始连载,首轮由乔斯·韦登编剧,约翰·卡萨迪绘制。随后由沃伦·埃利斯接手剧本,西蒙·比安奇和菲尔·希门尼斯负责艺术创作。[1] 丹尼尔·韦和克里斯托斯·盖奇交替撰写故事。之后詹姆斯·阿斯姆斯写了一期,格雷格·帕克在2011年11月接手四期。[2] 马乔里·刘为该系列最后21期执笔,直至2013年第68期完结。该标题的第四卷暨第二个连载系列于2017年"复活X"故事线期间推出。[3] 首轮由查尔斯·索尔编剧,多位艺术家轮换绘制。马修·罗森伯格和艺术家格雷格·兰德随后接手该系列直至2018年完结。最初的《惊世X战警》是四期限定系列,在1995年平行宇宙故事线"天启时代"中取代《非凡X战警》,所有X标题当时都改用新名称和期号。在这个故事线中,X教授在20年前被自己的儿子军团杀害。万磁王目睹挚友之死,决心继承X教授的梦想并组建了自己的X战警团队。然而他未能阻止暴君天启的崛起,因此该系列主要讲述X战警与天启的战斗。由斯科特·洛布德尔编剧、乔·马杜雷拉绘制的《惊世X战警》团队由罗刹女领导,成员包括阳炎、闪烁、魔形、剑齿虎和野孩子。来源: https://en.wikipedia.org/wiki/Astonishing_X-Men'
示例标题: 维基百科文章
模型索引:
- 名称: flan-t5-base-samsum
结果:
- 任务:
类型: 文本到文本生成
名称: 序列到序列语言建模
数据集:
名称: samsum
类型: samsum
配置: samsum
拆分: 测试
参数: samsum
指标:
- 类型: rouge
值: 46.8876
名称: Rouge1
- 任务:
类型: 摘要
名称: 摘要
数据集:
名称: samsum
类型: samsum
配置: samsum
拆分: 测试
指标:
- 类型: rouge
值: 47.1604
名称: ROUGE-1
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiYzAzNjBhZmU3ZWE1Nzg2OGNmNWQxZTRkMWI3MGJmY2U3NzdiN2NhMzA2ZGY2N2VmOGQzNThkZDg5YmI1NTQzMCIsInZlcnNpb24iOjF9.fj5dvLTJmdTud-r9NBx468b_q7128WFc84Oa_ogUq1YuHfgK9KRBJl0V8YVP-UrVOB-5Mwcy_kVo2gqUq2fQCA
- 类型: rouge
值: 23.5947
名称: ROUGE-2
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiY2ExZTYyMDMzYjQyZWU0NjY4YWZiN2NjMjAyNzUwMzU3ZjQxOTdjZDdhNjE0MDE1NDVmY2Y5MDEyZTI5ODA5ZCIsInZlcnNpb24iOjF9.4XKnhKi4PtU0KnyXnBDRop-tWwDvAgJqbWkuPAVUPThcCjVrpjLiSgTWP49NEK-l3QBaLluoh7M-OF8OTwasBQ
- 类型: rouge
值: 39.7299
名称: ROUGE-L
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiYWZiMDU1ODY4Y2ViOWJlZjhhZTAzNjY4NDhjYzdlYzg1MDRmZDM2ZDFkZGVhNjQzMmZjZDA3OWEzYjUzOTU0NCIsInZlcnNpb24iOjF9.EctQIDlK_ksR7NiCtHsxnWWzUF8WNmZ58JIsTUTjQPqmf8Igm82tihK78S4nit7IF24lug5_Ua7X5gWzMHDvDA
- 类型: rouge
值: 43.3052
名称: ROUGE-LSUM
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiMzQwYTMyOGNlNzJiNDEzMjQ5NzEwMzMyZmRhZDAxOGNhMWNkZjA0YWEyM2NkZGU3ODU3ZDU4ZWFhODkyNzNkOCIsInZlcnNpb24iOjF9.nsQAnUdVTySov7ZkNYJjMbIjb7V87D1w0HFLdOzSq5gaKuZmkAXmh14c_bL4Fbyf3AV_skLCDCJZEnsJHN7mDQ
- 类型: 损失
值: 1.3786224126815796
名称: 损失
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiNDgzMTkxY2EwOWU5MDgyODM3ZjE3MzBiN2Q0YmQ5MDI2MjI2NWNmMjUwZDY4MjZkZDg4ODcwMzVkN2Q4NTRmNSIsInZlcnNpb24iOjF9.vV700h6j3hdlzf-CEDIR3C9XND1jH3nW0r6Njgw0qB3Avfsq6zywr8ip2sxoo6aFCCQcmmcnmHiy7x1_xdwYAA
- 类型: 生成长度
值: 17.3443
名称: 生成长度
已验证: 是
验证令牌: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiNTNjYjFiYjgzNjBlMDY2MWUwZTVmY2Y1OWMwNGZkZTg0Mzc5ZmU2MWIwOWZlYWMzZGM1YWI0NTJjOTFhOTU2YiIsInZlcnNpb24iOjF9.-RshHr8uVG0B4qGh5Tr3bgqqai9R_Xho0M9iQyd5g0fyQJlYhIT12cUkcy2_NKUJEqu_JxSul723UWpiZgBHAQ
flan-t5-base-samsum
该模型是基于google/flan-t5-base在samsum数据集上微调的版本。
在评估集上取得了以下结果:
- 损失: 1.3709
- Rouge1: 46.8876
- Rouge2: 23.2689
- Rougel: 39.5369
- Rougelsum: 43.1602
- 生成长度: 17.2027
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率: 5e-05
- 训练批次大小: 8
- 评估批次大小: 8
- 随机种子: 42
- 优化器: 带betas=(0.9,0.999)和epsilon=1e-08的Adam
- 学习率调度器类型: 线性
- 训练轮数: 5
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
Rouge1 |
Rouge2 |
Rougel |
Rougelsum |
生成长度 |
1.4403 |
1.0 |
1842 |
1.3829 |
46.5321 |
23.0912 |
39.4008 |
42.8993 |
17.0977 |
1.3534 |
2.0 |
3684 |
1.3732 |
47.1111 |
23.4456 |
39.5462 |
43.2534 |
17.4554 |
1.2795 |
3.0 |
5526 |
1.3709 |
46.8876 |
23.2689 |
39.5369 |
43.1602 |
17.2027 |
1.2313 |
4.0 |
7368 |
1.3736 |
47.4418 |
23.701 |
39.9856 |
43.6294 |
17.2198 |
1.1934 |
5.0 |
9210 |
1.3772 |
47.4656 |
23.9199 |
40.0284 |
43.7039 |
17.3162 |
框架版本
- Transformers 4.26.1
- Pytorch 1.13.1+cu116
- Datasets 2.9.0
- Tokenizers 0.13.2