语言:
- 意大利语
许可证: apache-2.0
数据集:
- wits
标签:
- 意大利语
- 序列到序列
- 维基百科
- 摘要
- wits
小部件:
- 文本: "第五委员会负责审查涉及经济部预算、人事和服务具体事项的法案,以及财政相关法案。委员会由26名参议员组成(包括2名秘书、2名副主席其中1名为外部成员,以及1名主席),这些成员从议会该分支中均衡选出,以反映其政治力量构成。成员由议会党团提名(而非如议会委员会机构那样由主席任命):各党团在成立后五日内,向参议院主席团通报其在各常设委员会的代表人选。任何被任命为政府成员或当选委员会主席的参议员,在任职期间将由党团另派一名参议员接替其在委员会的席位,该接替者仍保留原委员会成员身份。除极少数情况外,任何参议员不得同时担任超过一个常设委员会成员。常设委员会在立法期首个两年后改组,其成员可连任。"
- 文本: "教堂内部 据推测,格迪米纳斯时代已存在一座小型木质教堂。约1408年,维陶塔斯建造了圣灵教堂,后经扩建。1501年,亚历山大·雅盖隆将其赠予立陶宛最古老的多米尼加修道院,该修道院在1679-88年间扩建重建。教堂墙壁保留自该时期,内部陈设则完成于1749-1770年,穹顶于1752-1760年修复。1844年,沙皇当局关闭修道院,教堂转为教区教堂,现服务于维尔纽斯的波兰社区。 圣伊格纳托街上1501年建有多米尼加修道院。与其他建筑类似,1807年沙皇当局将其改为监狱,曾关押许多立陶宛爱国者,特别是参与1831年和1863年起义的菲拉雷蒂成员。 管风琴 教堂侧临街道,无明确主立面。含穹顶总高51米。立面下部(带双小塔楼)被修道院建筑环绕,外观呈现晚期巴洛克特征。内部以洛可可风格装饰闻名,是立陶宛最著名的教堂之一:中殿布满纹章和壁画,设有16座祭坛。祭坛与讲坛布满圆雕和浮雕装饰。巴洛克壁画中,穹顶的《圣灵颂》(新巴洛克,19世纪)尤为突出,教堂藏有45幅画作(包括17或18世纪背景的圣芭芭拉像、西蒙·切霍维奇创作的洛可可风格锡耶纳的圣凯瑟琳像、18世纪下半叶无名艺术家所作的亚历山大·雅盖隆肖像)。 祭坛下入口通向迷宫般的地下拱顶,内有众多墓室:这里安葬着数百名维尔纽斯居民遗骸,部分自然木乃伊化,围绕这些遗骸流传着都市传说。尽管地下墓穴的存在广为人知,但20世纪30年代维尔纽斯大学学生的首次勘探尝试因未遵循考古规范而中断,反而造成破坏:他们将头骨集中摆放并移出棺木。此后遗骸多次被移动,处于混乱状态。传说这些遗骸属于1812年拿破仑远征俄罗斯时的法军士兵、宗教裁判所或黑死病受害者。更浪漫的说法是,地下通道曾是传奇恋人芭芭拉·拉齐维乌与齐格蒙特二世秘密相会的庞大网络一部分。2011年,维尔纽斯大学人类学家团队对木乃伊进行研究,估计墓穴保存约600具18世纪中叶至19世纪初的遗骸,包括许多妇女儿童。扫描显示多数死者超重且有拇外翻,表明其属于富裕阶层。"
- 文本: "该岛长8公里,宽3.2公里,位于雷诺岛东南1.6公里处,以罗德曼海峡分隔,海拔100米。1832年由英国探险家约翰·比斯科发现,20世纪初法国南极探险队绘制地图。探险由让-巴蒂斯特·沙尔科领导,岛名纪念法国探险家查尔斯·拉博。 === 领土主张 === * 阿根廷主张其属火地岛省南极部门 * 智利主张其属麦哲伦-智利南极大区南极省 * 英国主张其属英属南极领地 根据《南极条约》,这些主张均被搁置。岛上设有历史遗迹吉约雄避难所。"
- 文本: "万尼1948年在罗马玛格丽塔画廊举办首次个展。1949年获奖学金赴阿姆斯特丹师从新造型主义画家弗里德里希·沃登伯热-吉尔德瓦特。1952年获富布赖特奖学金赴耶鲁大学师从约瑟夫·亚伯斯。 1953-1960年定居巴黎,期间为儿童书籍绘制插图并获出版商俱乐部奖。1954年担任卢西亚诺·埃默尔执导的毕加索纪录片色彩顾问,1955年起与施耐德画廊长期合作,与科拉多·卡吉等艺术家共事。1969-1974年创作玻璃纤维浮雕作品,通过投影自制抽象影片实现画面动态变化。 1979年移居纽约,除绘画外还在库珀联盟艺术学院任教(1984-2014年)。 万尼的作品具有高度个人化特征,远离20世纪下半叶主流艺术潮流。受青年时期与未来主义哲学家阿尔贝托·布拉加利亚的对话影响,其创作呈现程式化的"折衷主义",建立在对多种技法(如马赛克、湿壁画、蛋彩画)的深刻掌握之上。虽多以抽象形式为主,但部分具象作品同样彰显其技艺。其插画成就显著,曾为阿尔贝托·莫拉维亚小说《阿戈斯蒂诺》、洛厄尔·西夫《爱与爱丽丝·科莱诺《水晶故事》绘制插图。作品曾在全球多地美术馆展出。"
指标:
- rouge
- bertscore
模型索引:
- 名称: it5-base-wiki-summarization
结果:
- 任务:
类型: wiki-summarization
名称: "维基百科摘要"
数据集:
类型: wits
名称: "WITS"
指标:
- 类型: rouge1
值: 0.369
名称: "测试Rouge1"
- 类型: rouge2
值: 0.217
名称: "测试Rouge2"
- 类型: rougeL
值: 0.333
名称: "测试RougeL"
- 类型: bertscore
值: 0.530
名称: "测试BERTScore"
参数:
- 模型类型: "dbmdz/bert-base-italian-xxl-uncased"
- 语言: "it"
- 层数: 10
- 基线重缩放: 是
- 基线路径: "bertscore_baseline_ita.tsv"
二氧化碳当量排放:
排放量: "17克"
来源: "谷歌云平台碳足迹"
训练类型: "微调"
地理位置: "荷兰埃姆斯哈文, 欧洲"
硬件使用: "1台TPU v3-8虚拟机"
缩略图: https://gsarti.com/publication/it5/featured.png
IT5基础版维基百科摘要模型 📑 🇮🇹
本仓库包含基于WITS数据集微调的IT5基础版模型检查点,作为论文IT5:意大利语理解与生成的大规模文本到文本预训练的实验成果之一,作者为Gabriele Sarti与Malvina Nissim。
完整发布材料概览请参阅gsarti/it5仓库。论文中提供了关于评分标准和评估方法的详细说明。
使用模型
模型检查点支持Tensorflow、Pytorch和JAX框架。可通过pipeline直接调用:
from transformers import pipelines
hg = pipeline("text2text-generation", model='it5/it5-base-wiki-summarization')
hg("该岛长8公里,宽3.2公里...(此处输入待摘要文本)")
>>> [{"generated_text": "'''拉博岛'''位于阿根廷南部,邻近雷诺岛。"}]
或通过自动类加载:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
tokenizer = AutoTokenizer.from_pretrained("it5/it5-base-wiki-summarization")
model = AutoModelForSeq2SeqLM.from_pretrained("it5/it5-base-wiki-summarization")
若在研究中引用本模型,请使用以下文献格式:
@article{sarti-nissim-2022-it5,
title={{IT5}: Large-scale Text-to-text Pretraining for Italian Language Understanding and Generation},
author={Sarti, Gabriele and Nissim, Malvina},
journal={ArXiv preprint 2203.03759},
url={https://arxiv.org/abs/2203.03759},
year={2022},
month={mar}
}