模型简介
模型特点
模型能力
使用案例
标签:
- 句子转换器
- 句子相似度
- 特征提取
- 训练生成
- 数据集大小:44978
- 损失函数:推理引导排序损失 基础模型: google-bert/bert-base-uncased 小部件:
- 源句: 恶劣天气席卷阿拉巴马大学,袭击东南部
句子:
-
第二段文本详细阐述了第一段文本的内容。它扩展了关于阿拉巴马州恶劣天气的初始陈述,提供了杰克逊维尔州立大学受损情况的具体细节、对周边地区的影响以及风暴的更广泛影响。
-
'劳工运动长期以来一直笼罩在全国对公共部门集体谈判权的攻击阴影下。我们多次讨论过Harris诉Quinn案,劳工如何在该案中侥幸逃脱,以及Scalia大法官去世使Friedrichs案未决前又逃过一劫。但Janus诉美国州、县、市政雇员联合会第31分会案很可能是劳工界一直担忧的案件,今天我们与世纪基金会的Andy Stettner一起为您解析。
我们还关注了优步在伦敦的失败和新自由主义在法国的失败,《洛杉矶时报》的工会运动以及飓风后前往波多黎各的劳工团结行动。在"Argh"栏目中,我们探讨了强迫劳动"康复"设施,以及如何通过左转来应对民粹主义右翼的崛起。
如果您认为我们在特朗普时代的坚持值得支持,请考虑成为Belabored的持续会员或向Dissent捐款订阅。帮助我们继续制作接下来的136期节目!'
-
'周一晚间,引发至少一场龙卷风的恶劣天气袭击了阿拉巴马州的杰克逊维尔州立大学,并向东南部其他地区蔓延。
阿拉巴马州警表示,阿拉巴马州杰克逊维尔市的损毁使该市看起来像"战区"。强风吹倒树木并损坏建筑物,美国国家气象局确认"一场破坏性且可能规模较大的龙卷风出现在杰克逊维尔和卡尔霍恩县附近,并正向东移动"。
杰克逊维尔州立大学体育总监Greg Seitz在推文中写道,校园遭受重大损失,包括新近翻修的Pete Mathews体育馆。
"我可以确认Pete Mathews体育馆屋顶严重受损,但体育馆并未完全毁坏,"Seitz在推文中表示。
塔斯卡卢萨县警长办公室中尉Andy Norris在推文中称,州警将杰克逊维尔称为"战区"。他表示体育馆屋顶"遭受重大损坏"。
社交媒体上的照片显示了杰克逊维尔遭受破坏的程度。
据WBRC-TV报道,阿拉巴马州州长Kay Ivey在周一晚间的声明中确认全州出现"重大损失"。
阿拉巴马州北部城市报告停电,亨茨维尔的美国国家气象局报告该地区至少出现三场龙卷风。
周一深夜,恶劣天气进入佐治亚州。
当破坏性大风进入该地区时,亚特兰大哈茨菲尔德机场的航班并未正式停飞。但机场在推特上警告可能会出现延误。
与此同时,据报道超过150人躲进了佐治亚州Cave Springs的一个历史洞穴中。
风暴导致阿拉巴马州至少15,000户家庭和企业停电。根据Cobb县新闻,佐治亚电力公司报告超过26,000名客户断电。
美联社对本报道亦有贡献。'
-
- 源句: NCAA性暴力政策被批评为软弱
句子:
-
第二段文本详细阐述了第一段文本中提到的批评内容。它描述了NCAA的新规则,然后提出了具体批评,指出政策中的明显弱点,如缺乏强有力的执行和问责机制,从而支持了最初关于政策软弱的说法。
-
'CHAMPAIGN -- 伊利诺伊州本周最后一次机会以强势招募结束。本周早些时候错失2018届三名前锋后,伊利诺伊人仍在争取四星佐治亚新秀Landers Nolley。
直到周五早上。Nolley,这位6尺7寸的侧翼球员在芝加哥Curie高中度过大二赛季后转学至佐治亚州,将其选择范围缩小至佐治亚和弗吉尼亚理工。
Nolley几乎最终的决定使伊利诺伊州本周在2018届目标上0胜4负,此前Lukas Kisunas(康涅狄格大学)、George Conditt(爱荷华州立)和Colin Castleton(密歇根大学)均已承诺他校。这使得伊利诺伊人继续追求州内目标,如Morgan Park的Ayo Dosunmu,他将于10月13日开始对伊利诺伊进行正式访问,以及Simeon的Talen Horton-Tucker。'
-
'美国大学体育协会上周通过的规则要求关键管理人员完成年度性暴力预防培训,并每年认证该机构的团队和项目熟悉预防性暴力的政策和流程或处理发生的事件。此外,规则要求机构向运动员提供有关机构政策和程序的信息。
《赫芬顿邮报》的一篇专栏文章指出,NCAA的规则与联邦法律对大学的要求大体相似,并且它们没有解决与被发现袭击他人的运动员相关的问题。专栏称,这些规则缺乏的是"执行或问责,其处罚力度接近为学生运动员购买一个汉堡包的水平"。'
-
- 源句: William Few Pkwy和Chamblin Rd新交通信号灯 - WFXG FOX 54 - 即时新闻
句子:
-
第二段文本详细阐述了标题中提到的交通信号灯。它指明了位置(William Few Parkway和Chamblin Road)以及信号灯运行的日程安排,包括信号灯将处于闪烁和正常模式的日期。
-
'哥伦比亚县希望告知驾驶公众新安装的交通信号灯。它位于William Few Parkway和Chamblin Road。
信号灯计划于2017年10月6日星期五进入闪烁模式。信号灯将在本周剩余时间包括周末保持闪烁模式。信号灯计划于2017年10月10日星期二进入正常停止和运行状态。
版权所有 2017 WFXG。保留所有权利。'
-
'加州新港滩(美联社)——关于南加州致命直升机坠毁的最新消息(所有时间均为当地时间):
上午10:07
加州当局公布了在新港滩居民区小型直升机坠毁中丧生的三人姓名。
橙县警长部门表示,死者为60岁的新港滩居民Joseph Anthony Tena、45岁的圣莫尼卡居民Kimberly Lynne Watzman和56岁的好莱坞居民Brian R. Reichelt。
周三居民区的坠机事件涉及直升机上的四人和一名旁观者。新港滩警方发言人Jennifer Manzella表示,所有三名遇难者均在直升机上。
没有关于两名受伤人员的信息。
晚上11:03
官员称,当直升机坠毁在南加州郊区的一户住宅时,三人遇难,另有两人受伤。
当局表示,当罗宾逊R44直升机周二下午从约翰韦恩机场起飞几分钟后在新港滩坠毁时,机上有四人。
一名当时在外面的地面人员卷入了坠机事件,但官员未具体说明谁遇难谁受伤。
邻居Marian Michaels表示,当直升机撞上房屋时,她以为是地震。
另一位邻居Roger Johnson表示,在冲往现场试图帮助之前,他听到了一声像是恐怖电影中的尖叫。'
-
- 源句: '报道:前司法部长、约旦前总理成为巴基斯坦国际法院临时法官首选'
句子:
-
第二段文本详细阐述了第一段关于临时法官职位候选人的内容。它列出了具体人选(前司法部长和约旦前总理),并提供了关于国际法院案件的背景、提名过程以及信息来源。该报道证实了标题中提供的信息。
-
'图片说明 Brian McGowan最后一次被确认见到是在9月21日的Plean
警方正在寻找一名已超过两周未被见到的男子,要求公众检查外屋和花园以寻找他的任何踪迹。
42岁的Brian McGowan最后一次被见到是在9月21日16:00斯特灵附近Plean的Gillespie Terrace地区。
调查发现了次日01:30在Gallamuir Drive地区"可能"见到他的情况。
警方表示,此后他未回家或联系任何人。
Donna Bryans督察表示:"Brian现已失踪两周,找到他至关重要。
"我要感谢当地社区出来寻找Brian并协助我们目前的调查。
"我要求Plean的居民和访客,以及Plean乡村公园的访客保持警惕,报告任何见到符合Brian描述的人。"
Bryans督察表示,对该地区花园和外屋的搜索可能有助于警官发现McGowan先生的下落。
他被描述为身高5英尺10英寸,瘦削身材,黑色短发。他有蓝眼睛和手指上的纹身,说话带有当地口音。
最后一次被见到时,他戴着黑色棒球帽,穿着黑色G-Star夹克、灰色阿玛尼毛衣、侧面有黑色条纹的灰色阿迪达斯运动裤和黑灰相间的阿迪达斯Y3运动鞋。'
-
'伊斯兰堡:巴基斯坦政府已开始就为国际法院审理的Kulbhushan Jadhav案提名临时法官进行磋商,前司法部长和约旦前总理成为首选人选,一家媒体今天报道。印度已向位于海牙的国际法院(ICJ)提出反对巴基斯坦军事法院对Jadhav判处死刑。ICJ于5月18日阻止巴基斯坦执行死刑。巴基斯坦政府官员已开始就提名临时法官进行磋商,《论坛快报》援引消息人士称。被罢免总理纳瓦兹·谢里夫任期内,曾接触前最高法院法官Khalilur Rehman Ramday,但他拒绝了提名,报道称。消息人士告诉该报,巴基斯坦总检察长办公室已向总理办公室推荐资深律师Makhdoom Ali Khan和前约旦总理Awn Shawkat Al-Khasawneh的名字,提名其中一人为临时法官。Khasawneh担任ICJ法官超过十年,而Khan作为前司法部长被视为该职位的有力竞争者,他在国际仲裁案件方面也有经验,曾代表八个不同国家在国际法院出庭。消息人士称,临时法官的提名将在获得外交部和军事机构的意见后最终确定,并补充说,早些时候,政府官员还考虑了巴基斯坦前首席大法官Tassaduq Hussain Jillani的名字。一位官员表示,临时法官的名字将于下月印度方面提交文件后最终确定。与此同时,巴基斯坦律师理事会(PBC)代表Raheel Kamran Sheikh呼吁政府就临时法官的任命寻求议会批准。巴基斯坦历史上仅有一人曾被任命为ICJ法官——前外交部长Zafarullah Khan,他于1954年被任命,后来成为法院院长。Yaqub Ali Khan和Sharifuddin Pirzada均曾担任临时法官,Zafarullah也是如此。'
-
- 源句: 能源倡导者呼吁对可再生能源增长做出新承诺
句子:
-
第二段文本详细阐述了能源倡导者呼吁可再生能源增长的具体背景。它指出了倡导者(CFE、VoteSolar、Environment Connecticut)、具体的可再生能源计划(社区太阳能)以及他们呼吁的原因,包括计划延迟和设计缺陷。
-
'以下内容由CFE、VoteSolar和Environment Connecticut提交,以回应共享太阳能试点计划的最新延迟。
太阳能和环保倡导者呼吁在康涅狄格州建立一个新的社区太阳能计划,该计划将为全州的家庭、市政当局和企业扩大太阳能接入、能源选择和消费者节省。这一要求是在今天能源和环境保护部(DEEP)技术听证会之后提出的,与会者审查了该州当前的共享清洁能源设施试点计划。该试点在过去两年中多次停滞,最近一次是在DEEP决定放弃所有收到的提案并发布新的项目请求之后。DEEP在听证会上听到了许多倡导者和开发者的意见,他们对这一最新延迟感到沮丧,并对试点的长期成功持怀疑态度。
当前的试点计划旨在为无法在自家屋顶安装太阳能的康涅狄格州能源客户扩大太阳能接入,但它存在缺陷,至今阻碍了任何开发。根据立法规定,该计划有几个设计不良的元素和一个目标太小,无法吸引私营部门的重大兴趣。以下是康涅狄格州清洁能源经济中利益相关者的声明:
"多年来,康涅狄格州错失了为所有消费者带来太阳能能源选择和更多清洁能源工作岗位的机会,"VoteSolar东北地区主任Sean Garren表示。"康涅狄格州平淡无奇的社区太阳能计划由于设计不良和缺乏必要规模的雄心,至今未能为任何居民解锁太阳能接入的好处,这是电力公司干预的结果。我们呼吁立法机构赶上新英格兰其他地区——以及全国——通过一个智能、结构良好的社区太阳能计划,旨在为全州消费者服务。"
"能源和环境保护部两年来的拖延和拒绝遵守法律实施社区太阳能计划,阻止了数万康涅狄格州家庭获得清洁、经济、安全的太阳能电力,"Environment Connecticut州主任Chris Phelps表示。"社区太阳能正在帮助其他州加速太阳能增长、创造就业和减少污染。康涅狄格州政策制定者现在应采取行动,创建一个大胆的社区太阳能计划。"
"共享太阳能计划在过去十年中席卷全国,但康涅狄格州被抛在了后面——失去了更健康的空气、投资资金和伴随全面、全州共享太阳能计划的绿色工作岗位,"康涅狄格环境基金气候和能源律师Claire Coleman表示。"DEEP决定重新开始已经过度限制的共享太阳能试点,使康涅狄格州进一步陷入黑暗。我们的气候和经济不能再等待。如果康涅狄格州有任何机会履行《全球变暖解决方案法案》下减少温室气体排放的义务,康涅狄格州的领导人必须迅速采取行动,通过全面的共享太阳能计划增加州内可再生能源。"
VoteSolar是一个非营利组织,致力于通过在全国范围内将太阳能能源带入主流来促进经济发展和能源独立。了解更多信息,请访问votesolar.org。'
-
'北京:财政部周二表示,中国将对交易新原油期货合约的外国投资者免征三年所得税,以期在备受期待的推出之际吸引海外资本。
周一开始的交易将标志着中国多年来推动创建亚洲首个原油期货基准的努力达到高潮,旨在使全球最大石油进口国在对亚洲销售的原油定价方面拥有更大影响力。
这将使运营新合约的上海国际能源交易中心每年在数万亿美元的石油期货交易中分得一杯羹。
财政部表示,外国经纪商从交易新的上海原油期货中获得的佣金将免征所得税。
尽管存在外汇兑换和潜在资本管制等问题的担忧,但免税可能有助于鼓励外国参与者参与新合约。
中信银行(处理外国投资者保证金存款的八家银行之一)的一位消息人士表示,迄今为止,寻求开设非居民账户以允许交易的外国投资者数量低于预期。该消息人士拒绝透露姓名,因为他无权与媒体交谈。
石油市场正密切关注该合约的流动性,因为机构投资者和经纪商预计交易量和未平仓合约量将相对较小,与中国铁矿石、铜和钢材期货合约相比。
中国近日提供了有关该合约的更多细节,包括保证金、交易限额和交易费用,并已批准使用六个保税仓库。' 数据集:
-
- bwang0911/reasoning_pairs_filtered_w_reason_ccnews 流水线标签: 句子相似度 库名称: sentence-transformers 指标:
- 余弦准确率@1
- 余弦准确率@3
- 余弦准确率@5
- 余弦准确率@10
- 余弦精确率@1
- 余弦精确率@3
- 余弦精确率@5
- 余弦精确率@10
- 余弦召回率@1
- 余弦召回率@3
- 余弦召回率@5
- 余弦召回率@10
- 余弦归一化折损累积增益@10
- 余弦平均倒数排名@10
- 余弦平均精度@100 模型索引:
- 名称: 基于google-bert/bert-base-uncased的SentenceTransformer
结果:
- 任务:
类型: 信息检索
名称: 信息检索
数据集:
名称: mteb/nfcorpus
类型: mteb/nfcorpus
指标:
- 类型: 余弦准确率@1 值: 0.3126934984520124 名称: 余弦准确率@1
- 类型: 余弦准确率@3 值: 0.47678018575851394 名称: 余弦准确率@3
- 类型: 余弦准确率@5 值: 0.5325077399380805 名称: 余弦准确率@5
- 类型: 余弦准确率@10 值: 0.5975232198142415 名称: 余弦准确率@10
- 类型: 余弦精确率@1 值: 0.3126934984520124 名称: 余弦精确率@1
- 类型: 余弦精确率@3 值: 0.2549019607843137 名称: 余弦精确率@3
- 类型: 余弦精确率@5 值: 0.20990712074303408 名称: 余弦精确率@5
- 类型: 余弦精确率@10 值: 0.16563467492260062 名称: 余弦精确率@10
- 类型: 余弦召回率@1 值: 0.03117827434222373 名称: 余弦召回率@1
- 类型: 余弦召回率@3 值: 0.05624265377613812 名称: 余弦召回率@3
- 类型: 余弦召回率@5 值: 0.06877168791903203 名称: 余弦召回率@5
- 类型: 余弦召回率@10 值: 0.09700903168215257 名称: 余弦召回率@10
- 类型: 余弦归一化折损累积增益@10 值: 0.21852791504742514 名称: 余弦归一化折损累积增益@10
- 类型: 余弦平均倒数排名@10 值: 0.40163890117450485 名称: 余弦平均倒数排名@10
- 类型: 余弦平均精度@100 值: 0.08949558554054256 名称: 余弦平均精度@100
- 任务:
类型: 信息检索
名称: 信息检索
数据集:
名称: mteb/trec covid
类型: mteb/trec-covid
指标:
- 类型: 余弦准确率@1 值: 0.62 名称: 余弦准确率@1
- 类型: 余弦准确率@3 值: 0.82 名称: 余弦准确率@3
- 类型: 余弦准确率@5 值: 0.92 名称: 余弦准确率@5
- 类型: 余弦准确率@10 值: 0.94 名称: 余弦准确率@10
- 类型: 余弦精确率@1 值: 0.62 名称: 余弦精确率@1
- 类型: 余弦精确率@3 值: 0.5599999999999999 名称: 余弦精确率@3
- 类型: 余弦精确率@5 值: 0.5519999999999999 名称: 余弦精确率@5
- 类型: 余弦精确率@10 值: 0.512 名称: 余弦精确率@10
- 类型: 余弦召回率@1 值: 0.0005213598128605203 名称: 余弦召回率@1
- 类型: 余弦召回率@3 值: 0.0014060584814840184 名称: 余弦召回率@3
- 类型: 余弦召回率@5 值: 0.0023515414225962748 名称: 余弦召回率@5
- 类型: 余弦召回率@10 值: 0.004357324560804962 名称: 余弦召回率@10
- 类型: 余弦归一化折损累积增益@10 值: 0.5323227421340048 名称: 余弦归一化折损累积增益@10
- 类型: 余弦平均倒数排名@10 值: 0.7306666666666668 名称: 余弦平均倒数排名@10
- 类型: 余弦平均精度@100 值: 0.22987991064708832 名称: 余弦平均精度@100
- 任务:
类型: 信息检索
名称: 信息检索
数据集:
名称: mteb/fiqa
类型: mteb/fiqa
指标:
- 类型: 余弦准确率@1 值: 0.13734567901234568 名称: 余弦准确率@1
- 类型: 余弦准确率@3 值: 0.22839506172839505 名称: 余弦准确率@3
- 类型: 余弦准确率@5 值: 0.2700617283950617 名称: 余弦准确率@5
- 类型: 余弦准确率@10 值: 0.345679012345679 名称: 余弦准确率@10
- 类型: 余弦精确率@1 值: 0.13734567901234568 名称: 余弦精确率@1
- 类型: 余弦精确率@3 值: 0.09310699588477366 名称: 余弦精确率@3
- 类型: 余弦精确率@5 值: 0.06944444444444445 名称: 余弦精确率@5
- 类型: 余弦精确率@10 值: 0.04645061728395062 名称: 余弦精确率@10
- 类型: 余弦召回率@1 值: 0.0697683960415442 名称: 余弦召回率@1
- 类型: 余弦召回率@3 值: 0.12649965346724604 名称: 余弦召回率@3
- 类型: 余弦召回率@5 值: 0.15659102129009536 名称: 余弦召回率@5
- 类型: 余弦召回率@10 值: 0.19997600136489024 名称: 余弦召回率@10
- 类型: 余弦归一化折损累积增益@10 值: 0.15747637847224993 名称: 余弦归一化折损累积增益@10
- 类型: 余弦平均倒数排名@10 值: 0.19570105820105824 名称: 余弦平均倒数排名@10
- 类型: 余弦平均精度@100 值: 0.12811920879354669 名称: 余弦平均精度@100
- 任务:
类型: 信息检索
名称: 信息检索
数据集:
名称: mteb/quora
类型: mteb/quora
指标:
- 类型: 余弦准确率@1 值: 0.7256 名称: 余弦准确率@1
- 类型: 余弦准确率@3 值: 0.8531 名称: 余弦准确率@3
- 类型: 余弦准确率@5 值: 0.8898 名称: 余弦准确率@5
- 类型: 余弦准确率@10 值: 0.9263 名称: 余弦准确率@10
- 类型: 余弦精确率@1 值: 0.7256 名称: 余弦精确率@1
- 类型: 余弦精确率@3 值: 0.33316666666666667 名称: 余弦精确率@3
- 类型: 余弦精确率@5 值: 0.21984 名称: 余弦精确率@5
- 类型: 余弦精确率@10 值: 0.12146000000000004 名称: 余弦精确率@10
- 类型: 余弦召回率@1 值: 0.6303186330948595 名称: 余弦召回率@1
- 类型: 余弦召回率@3 值: 0.7900249099696033 名称: 余弦召回率@3
- 类型: 余弦召回率@5 值: 0.838050682910748 名称: 余弦召回率@5
- 类型: 余弦召回率@10 值: 0.887497633693034 名称: 余弦召回率@10
- 类型: 余弦归一化折损累积增益@10 值: 0.8013139502721578 名称: 余弦归一化折损累积增益@10
- 类型: 余弦平均倒数排名@10 值: 0.7959599603174561 名称: 余弦平均倒数排名@10
- 类型: 余弦平均精度@100 值: 0.764750227681921 名称: 余弦平均精度@100
- 任务:
类型: 信息检索
名称: 信息检索
数据集:
名称: mteb/nfcorpus
类型: mteb/nfcorpus
指标:
基于google-bert/bert-base-uncased的SentenceTransformer
这是一个基于google-bert/bert-base-uncased微调的sentence-transformers模型,训练数据集为reason_unfiltered。它将句子和段落映射到768维密集向量空间,可用于语义文本相似性、语义搜索、释义挖掘、文本分类、聚类等任务。
模型详情
模型描述
- 模型类型: 句子转换器
- 基础模型: google-bert/bert-base-uncased
- 最大序列长度: 196个标记
- 输出维度: 768维
- 相似性函数: 余弦相似性
- 训练数据集:
模型来源
- 文档: Sentence Transformers文档
- 仓库: GitHub上的Sentence Transformers
- Hugging Face: Hugging Face上的Sentence Transformers
完整模型架构
SentenceTransformer(
(0): Transformer({'max_seq_length': 196, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
使用
直接使用(Sentence Transformers)
首先安装Sentence Transformers库:
pip install -U sentence-transformers
然后您可以加载此模型并运行推理。
from sentence_transformers import SentenceTransformer
# 从🤗 Hub下载
model = SentenceTransformer("bwang0911/reasoning-bert-ccnews")
# 运行推理
sentences = [
'能源倡导者呼吁对可再生能源增长做出新承诺',
'以下内容由CFE、VoteSolar和Environment Connecticut提交,以回应共享太阳能试点计划的最新延迟。\n太阳能和环保倡导者呼吁在康涅狄格州建立一个新的社区太阳能计划,该计划将为全州的家庭、市政当局和企业扩大太阳能接入、能源选择和消费者节省。这一要求是在今天能源和环境保护部(DEEP)技术听证会之后提出的,与会者审查了该州当前的共享清洁能源设施试点计划。该试点在过去两年中多次停滞,最近一次是在DEEP决定放弃所有收到的提案并发布新的项目请求之后。DEEP在听证会上听到了许多倡导者和开发者的意见,他们对这一最新延迟感到沮丧,并对试点的长期成功持怀疑态度。\n当前的试点计划旨在为无法在自家屋顶安装太阳能的康涅狄格州能源客户扩大太阳能接入,但它存在缺陷,至今阻碍了任何开发。根据立法规定,该计划有几个设计不良的元素和一个目标太小,无法吸引私营部门的重大兴趣。以下是康涅狄格州清洁能源经济中利益相关者的声明:\n“多年来,康涅狄格州错失了为所有消费者带来太阳能能源选择和更多清洁能源工作岗位的机会,”VoteSolar东北地区主任Sean Garren表示。“康涅狄格州平淡无奇的社区太阳能计划由于设计不良和缺乏必要规模的雄心,至今未能为任何居民解锁太阳能接入的好处,这是电力公司干预的结果。我们呼吁立法机构赶上新英格兰其他地区——以及全国——通过一个智能、结构良好的社区太阳能计划,旨在为全州消费者服务。”\n“能源和环境保护部两年来的拖延和拒绝遵守法律实施社区太阳能计划,阻止了数万康涅狄格州家庭获得清洁、经济、安全的太阳能电力,”Environment Connecticut州主任Chris Phelps表示。“社区太阳能正在帮助其他州加速太阳能增长、创造就业和减少污染。康涅狄格州政策制定者现在应采取行动,创建一个大胆的社区太阳能计划。”\n“共享太阳能计划在过去十年中席卷全国,但康涅狄格州被抛在了后面——失去了更健康的空气、投资资金和伴随全面、全州共享太阳能计划的绿色工作岗位,”康涅狄格环境基金气候和能源律师Claire Coleman表示。“DEEP决定重新开始已经过度限制的共享太阳能试点,使康涅狄格州进一步陷入黑暗。我们的气候和经济不能再等待。如果康涅狄格州有任何机会履行《全球变暖解决方案法案》下减少温室气体排放的义务,康涅狄格州的领导人必须迅速采取行动,通过全面的共享太阳能计划增加州内可再生能源。”\nVoteSolar是一个非营利组织,致力于通过在全国范围内将太阳能能源带入主流来促进经济发展和能源独立。了解更多信息,请访问votesolar.org。',
"第二段文本详细阐述了能源倡导者呼吁可再生能源增长的具体背景。它指出了倡导者(CFE、VoteSolar、Environment Connecticut)、具体的可再生能源计划(社区太阳能)以及他们呼吁的原因,包括计划延迟和设计缺陷。",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# 获取嵌入的相似性分数
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
评估
指标
信息检索
- 数据集:
mteb/nfcorpus
,mteb/trec-covid
,mteb/fiqa
和mteb/quora
- 使用
InformationRetrievalEvaluator
评估
指标 | mteb/nfcorpus | mteb/trec-covid | mteb/fiqa | mteb/quora |
---|---|---|---|---|
余弦准确率@1 | 0.3127 | 0.62 | 0.1373 | 0.7256 |
余弦准确率@3 | 0.4768 | 0.82 | 0.2284 | 0.8531 |
余弦准确率@5 | 0.5325 | 0.92 | 0.2701 | 0.8898 |
余弦准确率@10 | 0.5975 | 0.94 | 0.3457 | 0.9263 |
余弦精确率@1 | 0.3127 | 0.62 | 0.1373 | 0.7256 |
余弦精确率@3 | 0.2549 | 0.56 | 0.0931 | 0.3332 |
余弦精确率@5 | 0.2099 | 0.552 | 0.0694 | 0.2198 |
余弦精确率@10 | 0.1656 | 0.512 | 0.0465 | 0.1215 |
余弦召回率@1 | 0.0312 | 0.0005 | 0.0698 | 0.6303 |
余弦召回率@3 | 0.0562 | 0.0014 | 0.1265 | 0.79 |
余弦召回率@5 | 0.0688 | 0.0024 | 0.1566 | 0.8381 |
余弦召回率@10 | 0.097 | 0.0044 | 0.2 | 0.8875 |
余弦归一化折损累积增益@10 | 0.2185 | 0.5323 | 0.1575 | 0.8013 |
余弦平均倒数排名@10 | 0.4016 | 0.7307 | 0.1957 | 0.796 |
余弦平均精度@100 | 0.0895 | 0.2299 | 0.1281 | 0.7648 |
训练详情
训练数据集
reason_unfiltered
- 数据集: reason_unfiltered 在 2e4fb05
- 大小: 44,978个训练样本
- 列:
title
,body
, 和reason
- 基于前1000个样本的近似统计:
title body reason 类型 string string string 详情 - 最小: 6个标记
- 平均: 15.34个标记
- 最大: 42个标记
- 最小: 21个标记
- 平均: 178.04个标记
- 最大: 196个标记
- 最小: 28个标记
- 平均: 59.19个标记
- 最大: 88个标记
- 样本:
title body reason Fight Leaves Wayne Simmonds Shirtless
Reed Saxon/AP Images
Kevin Bieksa和Wayne Simmonds在昨晚鸭子队4-3点球战胜飞人队的比赛中仅95秒就放下手套,Bieksa立即将对手的球衣拉过头顶,观众欢呼,Simmonds和裁判也笑了。
这不应该发生。NHL球员佩戴一种称为打架带的东西,它将球衣背面绑在裤子上,防止球衣被拉掉。(在打架中失去球衣是一种优势,因为它让赤膊球员的对手无法抓住任何东西。水牛城执法者Rob Ray以在打架中失去装备而闻名,有时在抱摔前自己脱掉装备。)任何未佩戴打架带参与打架的球员将被自动判罚比赛犯规。
广告
Simmonds没有被驱逐;在上面的视频一分钟标记处,您可以看到他的







