C
Climate Science Reranker
由 nicolauduran45 开发
这是一个基于交叉编码器的气候科学文本重排序模型,专门用于气候科学领域的语义搜索和文本相关性排序。
下载量 26
发布时间 : 5/12/2025
模型介绍
内容详情
替代品
模型简介
该模型计算文本对的分数,可用于气候科学领域的文本重排序和语义搜索任务,基于MiniLM-L6-v2架构微调而来。
模型特点
气候科学领域优化
专门针对气候科学领域的文本进行了微调,能够更好地理解该领域的专业术语和概念。
高性能重排序
在气候科学评估数据集上取得了0.7068的NDCG@10分数,表现优异。
高效推理
基于MiniLM架构,在保持高性能的同时具有较高的推理效率。
模型能力
文本相关性评分
语义搜索重排序
气候科学领域文本理解
使用案例
学术研究
气候科学文献检索
用于气候科学领域的文献检索系统,提高搜索结果的相关性。
在气候科学评估数据集上NDCG@10达到0.7068
研究论文推荐
根据用户查询推荐最相关的气候科学研究论文。
信息检索
气候政策文档检索
帮助政策制定者快速找到与特定气候议题相关的政策文档。
language:
- en license: apache-2.0 tags:
- sentence-transformers
- cross-encoder
- generated_from_trainer
- dataset_size:263476
- loss:BinaryCrossEntropyLoss base_model: cross-encoder/ms-marco-MiniLM-L6-v2 pipeline_tag: text-ranking library_name: sentence-transformers metrics:
- map
- mrr@10
- ndcg@10 model-index:
- name: Climate-Science-Reranker
results:
- task:
type: cross-encoder-reranking
name: Cross Encoder Reranking
dataset:
name: climate science eval
type: climate-science-eval
metrics:
- type: map value: 0.6629 name: Map
- type: mrr@10 value: 0.6554 name: Mrr@10
- type: ndcg@10 value: 0.7068 name: Ndcg@10
- task:
type: cross-encoder-reranking
name: Cross Encoder Reranking
dataset:
name: climate science eval
type: climate-science-eval
metrics:
气候科学重排序器
这是一个基于交叉编码器的模型,使用sentence-transformers库从cross-encoder/ms-marco-MiniLM-L6-v2微调而来。它计算文本对的分数,可用于文本重排序和语义搜索。
模型详情
模型描述
- 模型类型: 交叉编码器
- 基础模型: cross-encoder/ms-marco-MiniLM-L6-v2
- 最大序列长度: 512 tokens
- 输出标签数量: 1 label
- 语言: en
- 许可证: apache-2.0
模型来源
- 文档: Sentence Transformers 文档
- 文档: 交叉编码器文档
- 仓库: Sentence Transformers on GitHub
- Hugging Face: Hugging Face上的交叉编码器
使用方式
直接使用 (Sentence Transformers)
首先安装Sentence Transformers库:
pip install -U sentence-transformers
然后可以加载此模型并运行推理。
from sentence_transformers import CrossEncoder
# 从🤗 Hub下载
model = CrossEncoder("cross_encoder_model_id")
# 获取文本对的分数
pairs = [
["研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。", '当前,人们重新对利用巨大的潮汐资源以应对气候变化和能源安全双重挑战产生了兴趣。然而,在英国,没有一项潮汐拦河坝提案通过开发阶段,这是由于高成本和环境问题的综合影响。本文展示了如何将框架(如西北水电资源模型)应用于潮汐拦河坝,并以默西河拦河坝为案例研究。该模型的实现旨在为开发者提供一个工具,以成功识别特定位置水电方案的容量。资源模型的一个关键特征是理解到小型水电利用的障碍不是单一的,而是多个障碍共同阻碍了开发。因此,本文部分贡献于对潮汐拦河坝的全面整体处理,认识到除了能源生产外,其他环境、社会和经济机会也会出现,必须进行全面调查以进行稳健的决策。本研究展示了如何考虑人们的社会需求和补偿栖息地的必要性,例如,开发了一种有机建筑设计,旨在增强而非削弱默西河。'],
["研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。", '彩虹通过提供与自然的启发式联系,为人类福祉做出贡献。由于彩虹是一种大气光学现象,由阳光通过雨滴折射产生,人为气候强迫导致的降水和云量变化将改变彩虹的分布。然而,我们对彩虹当前的空间分布以及气候变化可能如何改变这一模式缺乏基本理解。为了评估气候变化可能如何影响彩虹观赏机会,我们开发了一个全球众包拍摄彩虹的数据库,训练了一个彩虹出现的经验模型,并将该模型应用于当前气候和三种未来气候情景。结果表明,目前地球上平均每个陆地位置每年有117±71天具备适合彩虹的条件。到2100年,气候变化可能会使全球年平均彩虹日(即至少出现一次彩虹的日子)净增加4.0-4.9%,在最高排放情景下变化最大。约21-34%的陆地面积将失去彩虹日,66-79%将获得彩虹日,彩虹增加的热点主要位于人口较少的高纬度和高海拔地区。我们的研究表明,气候变化对非有形环境属性的改变可能是显著的,值得考虑和缓解。'],
["研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。", '恐龙成为陆地生态系统主导成分的崛起是生命历史上的一个关键事件,然而其早期进化和生物多样性的驱动因素尚不清楚。1Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化的前50 Myr:宏观进化模式和形态差异.Biol. Lett. 2008; 4: 733-736https://doi.org/10.1098/rsbl.2008.0441Crossref PubMed Scopus (105) Google Scholar,2Irmis R.B. 评估恐龙早期多样化的假设.Earth Environ. Sci. Trans. R. Soc. Edinb. 2010; 101: 397-426https://doi.org/10.1017/S1755691011020068Crossref Scopus (94) Google Scholar,3Benton M.J. Forth J. Langer M.C. 恐龙崛起的模型.Curr. Biol. 2014; 24: R87-R95https://doi.org/10.1016/j.cub.2013.11.063Abstract Full Text Full Text PDF PubMed Scopus (93) Google Scholar 在晚三叠纪的早期多样化过程中,恐龙最初稀少且地理分布受限,仅在晚三叠纪大灭绝事件后才获得更广泛的分布和更大的丰度。4Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化辐射中的优越性、竞争和机会主义.Science. 2008; 321: 1485-1488https://doi.org/10.1126/science.1161833Crossref PubMed Scopus (334) Google Scholar,5Langer M.C. Ezcurra M.D. Bittencourt J.S. Novas F.E. 恐龙的起源和早期进化.Biol. Rev. Camb. Philos. Soc. 2010; 85: 55-110https://doi.org/10.1111/j.1469-185X.2009.00094.xCrossref PubMed Scopus (212) Google Scholar,6Langer M.C. Godoy P.L. 火山创造了恐龙?对陆地泛鸟类早期进化的定量描述.Front. Earth Sci. 2022; 10https://doi.org/10.3389/feart.2022.899562Crossref PubMed Scopus (3) Google Scholar 这一模式与机会主义扩张模型一致,由共存的类群(如鳄形类、劳氏鳄类和兽孔类)的灭绝引发。4Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化辐射中的优越性、竞争和机会主义.Science. 2008; 321: 1485-1488https://doi.org/10.1126/science.1161833Crossref PubMed Scopus (334) Google Scholar,7Tucker M.E. Benton M.J. 三叠纪环境、气候和爬行动物进化.Palaeogeogr. Palaeoclimatol. Palaeoecol. 1982; 40: 361-379https://doi.org/10.1016/0031-0182(82)90034-7Crossref Scopus (89) Google Scholar,8Benton M.J. 三叠纪恐龙成功的非竞争生态模型.Q. Rev. Biol. 1983; 58: 29-55Crossref Scopus (170) Google Scholar 然而,这一模式可能是对三叠纪至侏罗纪过渡期间全球气候分布变化的响应,特别是考虑到越来越多的证据表明气候在限制三叠纪恐龙分布中发挥了关键作用。7Tucker M.E. Benton M.J. 三叠纪环境、气候和爬行动物进化.Palaeogeogr. Palaeoclimatol. Palaeoecol. 1982; 40: 361-379https://doi.org/10.1016/0031-0182(82)90034-7Crossref Scopus (89) Google Scholar,9Whiteside J.H. Lindström S. Irmis R.B. Glasspool I.J. Schaller M.F. Dunlavey M. Nesbitt S.J. Smith N.D. Turner A.H. 极端生态系统不稳定性抑制热带恐龙优势达3000万年.Proc. Natl. Acad. Sci. USA. 2015; 112: 7909-7913https://doi.org/10.1073/pnas.1505252112Crossref PubMed Scopus (61) Google Scholar,10Bernardi M. Gianolla P. Petti F.M. Mietto P. Benton M.J. 恐龙多样化与卡尼期洪积事件相关.Nat. Commun. 2018; 9: 1499https://doi.org/10.1038/s41467-018-03996-1Crossref PubMed Scopus (87) Google Scholar,11Lovelace D.M. Hartman S.A. Mathewson P.D. Linzmeier B.J. Porter W.P. 模拟恐龙:使用关联的机械生理学和微气候模型探索恐龙早期进化的环境、生理和形态约束.PLoS One. 2020; 15e0223872https://doi.org/10.1371/journal.pone.0223872Crossref Scopus (8) Google Scholar,12Mancuso A.C. Benavente C.A. Irmis R.B. Mundil R. 冈瓦纳卡尼期洪积事件的证据:新的多代理气候记录及其对恐龙早期多样化的影响.Gondwana Res. 2020; 86: 104-125https://doi.org/10.1016/j.gr.2020.05.009Crossref Scopus (35) Google Scholar,13Mancuso A.C. Irmis R.B. Pedernera T.E. Gaetano L.C. Benavente C.A. Breeden III B.T. 阿根廷晚三叠纪的古环境和生物变化:在盆地尺度上测试非生物驱动假设.Front. Earth Sci. 2022; 10https://doi.org/10.3389/feart.2022.883788Crossref PubMed Scopus (4) Google Scholar,14Kent D.V. Clemmensen L.B. 恐龙从中诺利期(215-212 Ma,晚三叠纪)大气pCO2下降时从冈瓦纳向北扩散到格陵兰.Proc. Natl. Acad. Sci. USA. 2021; 118e2020778118https://doi.org/10.1073/pnas.2020778118Crossref Scopus (16) Google Scholar,15Griffin C.T. Wynd B.M. Munyikwa D. Broderick T.J. Zondo M. Tolan S. Langer M.C. Nesbitt S.J. Taruvinga H.R. 非洲最古老的恐龙揭示了恐龙分布的早期抑制.Nature. 2022; 609: 313-319https://doi.org/10.1038/s41586-022-05133-xCrossref PubMed Scopus (4) Google Scholar,16Olsen P. Sha J. Fang Y. Chang C. Whiteside J.H. Kinney S. Sues H.-D. Kent D. Schaller M. Vajda V. 北极冰和恐龙的生态崛起.Sci. Adv. 2022; 8eabo6342https://doi.org/10.1126/sciadv.abo6342Crossref Scopus (5) Google Scholar 在这里,我们通过定量检查三叠纪-侏罗纪边界恐龙和四足动物"气候生态位空间"的变化来检验这一假设并阐明气候如何影响早期恐龙分布。统计分析表明,晚三叠纪蜥脚类恐龙占据的气候生态位空间比其他四足动物和恐龙更为受限,被排除在最热的低纬度气候区之外。随后,早侏罗世蜥脚类地理分布的扩张与其偏好气候条件的扩张相关。进化模型拟合分析为蜥脚类起源期间从较冷到较暖气候生态位的重要进化转变提供了证据。这些结果与蜥脚类恐龙全球丰度由气候变化促进的假设一致,并支持气候在恐龙崛起中的关键作用。'],
["研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。", '减缓气候变化技术的发展已被确定为全球当务之急。然而,此类"绿色"技术可能对生物多样性产生负面影响。我们探讨了气候变化和用于绿色技术的锂开采如何影响智利安第斯山脉"锂三角"地区的地表水可用性、初级生产力和三种受威胁且具有重要经济意义的火烈鸟物种的丰度。我们结合气候和初级生产力数据、遥感地表水位测量以及30年火烈鸟丰度数据集,使用结构方程模型进行分析。我们发现,在区域范围内,火烈鸟丰度因地表水位和初级生产力的年际变化而剧烈波动,但未表现出任何时间趋势。在当地,在锂开采集中的阿塔卡马盐沼,我们发现开采与三种火烈鸟中两种的丰度呈负相关。这些结果表明,锂开采的持续增加和地表水的减少可能很快对火烈鸟在其分布范围内的丰度产生显著影响。因此,迫切需要努力减缓采矿扩张和气候变化的影响,以造福当地生物多样性及依赖它的当地人类经济。'],
["研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。", '河流在称为决口的罕见事件中会突然改变路径,导致毁灭性洪水。由于对此类特征的稀疏数据,对决口位置的控制知之甚少。我们分析了近50年的卫星图像,记录了全球113次决口,表明决口位置有三种不同的控制因素。扇状地的决口与河谷限制变化一致,而三角洲的决口主要集中在水回水区,表明洪水期间空间流动减速或加速的控制。然而,38%的三角洲决口发生在回水效应上游。这些事件发生在热带和沙漠环境中的陡峭、富含沉积物的河流中。我们的结果表明,三角洲决口位置由洪水驱动的侵蚀上游范围决定,通常限于回水区,但在陡峭、富含沉积物的河流中可以延伸至上游很远。我们的发现阐明了决口灾害可能如何响应土地利用和气候变化。'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5,)
# 或根据与单个文本的相似性对不同文本进行排序
ranks = model.rank(
"研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。",
[
'当前,人们重新对利用巨大的潮汐资源以应对气候变化和能源安全双重挑战产生了兴趣。然而,在英国,没有一项潮汐拦河坝提案通过开发阶段,这是由于高成本和环境问题的综合影响。本文展示了如何将框架(如西北水电资源模型)应用于潮汐拦河坝,并以默西河拦河坝为案例研究。该模型的实现旨在为开发者提供一个工具,以成功识别特定位置水电方案的容量。资源模型的一个关键特征是理解到小型水电利用的障碍不是单一的,而是多个障碍共同阻碍了开发。因此,本文部分贡献于对潮汐拦河坝的全面整体处理,认识到除了能源生产外,其他环境、社会和经济机会也会出现,必须进行全面调查以进行稳健的决策。本研究展示了如何考虑人们的社会需求和补偿栖息地的必要性,例如,开发了一种有机建筑设计,旨在增强而非削弱默西河。',
'彩虹通过提供与自然的启发式联系,为人类福祉做出贡献。由于彩虹是一种大气光学现象,由阳光通过雨滴折射产生,人为气候强迫导致的降水和云量变化将改变彩虹的分布。然而,我们对彩虹当前的空间分布以及气候变化可能如何改变这一模式缺乏基本理解。为了评估气候变化可能如何影响彩虹观赏机会,我们开发了一个全球众包拍摄彩虹的数据库,训练了一个彩虹出现的经验模型,并将该模型应用于当前气候和三种未来气候情景。结果表明,目前地球上平均每个陆地位置每年有117±71天具备适合彩虹的条件。到2100年,气候变化可能会使全球年平均彩虹日(即至少出现一次彩虹的日子)净增加4.0-4.9%,在最高排放情景下变化最大。约21-34%的陆地面积将失去彩虹日,66-79%将获得彩虹日,彩虹增加的热点主要位于人口较少的高纬度和高海拔地区。我们的研究表明,气候变化对非有形环境属性的改变可能是显著的,值得考虑和缓解。',
'恐龙成为陆地生态系统主导成分的崛起是生命历史上的一个关键事件,然而其早期进化和生物多样性的驱动因素尚不清楚。1Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化的前50 Myr:宏观进化模式和形态差异.Biol. Lett. 2008; 4: 733-736https://doi.org/10.1098/rsbl.2008.0441Crossref PubMed Scopus (105) Google Scholar,2Irmis R.B. 评估恐龙早期多样化的假设.Earth Environ. Sci. Trans. R. Soc. Edinb. 2010; 101: 397-426https://doi.org/10.1017/S1755691011020068Crossref Scopus (94) Google Scholar,3Benton M.J. Forth J. Langer M.C. 恐龙崛起的模型.Curr. Biol. 2014; 24: R87-R95https://doi.org/10.1016/j.cub.2013.11.063Abstract Full Text Full Text PDF PubMed Scopus (93) Google Scholar 在晚三叠纪的早期多样化过程中,恐龙最初稀少且地理分布受限,仅在晚三叠纪大灭绝事件后才获得更广泛的分布和更大的丰度。4Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化辐射中的优越性、竞争和机会主义.Science. 2008; 321: 1485-1488https://doi.org/10.1126/science.1161833Crossref PubMed Scopus (334) Google Scholar,5Langer M.C. Ezcurra M.D. Bittencourt J.S. Novas F.E. 恐龙的起源和早期进化.Biol. Rev. Camb. Philos. Soc. 2010; 85: 55-110https://doi.org/10.1111/j.1469-185X.2009.00094.xCrossref PubMed Scopus (212) Google Scholar,6Langer M.C. Godoy P.L. 火山创造了恐龙?对陆地泛鸟类早期进化的定量描述.Front. Earth Sci. 2022; 10https://doi.org/10.3389/feart.2022.899562Crossref PubMed Scopus (3) Google Scholar 这一模式与机会主义扩张模型一致,由共存的类群(如鳄形类、劳氏鳄类和兽孔类)的灭绝引发。4Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化辐射中的优越性、竞争和机会主义.Science. 2008; 321: 1485-1488https://doi.org/10.1126/science.1161833Crossref PubMed Scopus (334) Google Scholar,7Tucker M.E. Benton M.J. 三叠纪环境、气候和爬行动物进化.Palaeogeogr. Palaeoclimatol. Palaeoecol. 1982; 40: 361-379https://doi.org/10.1016/0031-0182(82)90034-7Crossref Scopus (89) Google Scholar,8Benton M.J. 三叠纪恐龙成功的非竞争生态模型.Q. Rev. Biol. 1983; 58: 29-55Crossref Scopus (170) Google Scholar 然而,这一模式可能是对三叠纪至侏罗纪过渡期间全球气候分布变化的响应,特别是考虑到越来越多的证据表明气候在限制三叠纪恐龙分布中发挥了关键作用。7Tucker M.E. Benton M.J. 三叠纪环境、气候和爬行动物进化.Palaeogeogr. Palaeoclimatol. Palaeoecol. 1982; 40: 361-379https://doi.org/10.1016/0031-0182(82)90034-7Crossref Scopus (89) Google Scholar,9Whiteside J.H. Lindström S. Irmis R.B. Glasspool I.J. Schaller M.F. Dunlavey M. Nesbitt S.J. Smith N.D. Turner A.H. 极端生态系统不稳定性抑制热带恐龙优势达3000万年.Proc. Natl. Acad. Sci. USA. 2015; 112: 7909-7913https://doi.org/10.1073/pnas.1505252112Crossref PubMed Scopus (61) Google Scholar,10Bernardi M. Gianolla P. Petti F.M. Mietto P. Benton M.J. 恐龙多样化与卡尼期洪积事件相关.Nat. Commun. 2018; 9: 1499https://doi.org/10.1038/s41467-018-03996-1Crossref PubMed Scopus (87) Google Scholar,11Lovelace D.M. Hartman S.A. Mathewson P.D. Linzmeier B.J. Porter W.P. 模拟恐龙:使用关联的机械生理学和微气候模型探索恐龙早期进化的环境、生理和形态约束.PLoS One. 2020; 15e0223872https://doi.org/10.1371/journal.pone.0223872Crossref Scopus (8) Google Scholar,12Mancuso A.C. Benavente C.A. Irmis R.B. Mundil R. 冈瓦纳卡尼期洪积事件的证据:新的多代理气候记录及其对恐龙早期多样化的影响.Gondwana Res. 2020; 86: 104-125https://doi.org/10.1016/j.gr.2020.05.009Crossref Scopus (35) Google Scholar,13Mancuso A.C. Irmis R.B. Pedernera T.E. Gaetano L.C. Benavente C.A. Breeden III B.T. 阿根廷晚三叠纪的古环境和生物变化:在盆地尺度上测试非生物驱动假设.Front. Earth Sci. 2022; 10https://doi.org/10.3389/feart.2022.883788Crossref PubMed Scopus (4) Google Scholar,14Kent D.V. Clemmensen L.B. 恐龙从中诺利期(215-212 Ma,晚三叠纪)大气pCO2下降时从冈瓦纳向北扩散到格陵兰.Proc. Natl. Acad. Sci. USA. 2021; 118e2020778118https://doi.org/10.1073/pnas.2020778118Crossref Scopus (16) Google Scholar,15Griffin C.T. Wynd B.M. Munyikwa D. Broderick T.J. Zondo M. Tolan S. Langer M.C. Nesbitt S.J. Taruvinga H.R. 非洲最古老的恐龙揭示了恐龙分布的早期抑制.Nature. 2022; 609: 313-319https://doi.org/10.1038/s41586-022-05133-xCrossref PubMed Scopus (4) Google Scholar,16Olsen P. Sha J. Fang Y. Chang C. Whiteside J.H. Kinney S. Sues H.-D. Kent D. Schaller M. Vajda V. 北极冰和恐龙的生态崛起.Sci. Adv. 2022; 8eabo6342https://doi.org/10.1126/sciadv.abo6342Crossref Scopus (5) Google Scholar 在这里,我们通过定量检查三叠纪-侏罗纪边界恐龙和四足动物"气候生态位空间"的变化来检验这一假设并阐明气候如何影响早期恐龙分布。统计分析表明,晚三叠纪蜥脚类恐龙占据的气候生态位空间比其他四足动物和恐龙更为受限,被排除在最热的低纬度气候区之外。随后,早侏罗世蜥脚类地理分布的扩张与其偏好气候条件的扩张相关。进化模型拟合分析为蜥脚类起源期间从较冷到较暖气候生态位的重要进化转变提供了证据。这些结果与蜥脚类恐龙全球丰度由气候变化促进的假设一致,并支持气候在恐龙崛起中的关键作用。',
'减缓气候变化技术的发展已被确定为全球当务之急。然而,此类"绿色"技术可能对生物多样性产生负面影响。我们探讨了气候变化和用于绿色技术的锂开采如何影响智利安第斯山脉"锂三角"地区的地表水可用性、初级生产力和三种受威胁且具有重要经济意义的火烈鸟物种的丰度。我们结合气候和初级生产力数据、遥感地表水位测量以及30年火烈鸟丰度数据集,使用结构方程模型进行分析。我们发现,在区域范围内,火烈鸟丰度因地表水位和初级生产力的年际变化而剧烈波动,但未表现出任何时间趋势。在当地,在锂开采集中的阿塔卡马盐沼,我们发现开采与三种火烈鸟中两种的丰度呈负相关。这些结果表明,锂开采的持续增加和地表水的减少可能很快对火烈鸟在其分布范围内的丰度产生显著影响。因此,迫切需要努力减缓采矿扩张和气候变化的影响,以造福当地生物多样性及依赖它的当地人类经济。',
'河流在称为决口的罕见事件中会突然改变路径,导致毁灭性洪水。由于对此类特征的稀疏数据,对决口位置的控制知之甚少。我们分析了近50年的卫星图像,记录了全球113次决口,表明决口位置有三种不同的控制因素。扇状地的决口与河谷限制变化一致,而三角洲的决口主要集中在水回水区,表明洪水期间空间流动减速或加速的控制。然而,38%的三角洲决口发生在回水效应上游。这些事件发生在热带和沙漠环境中的陡峭、富含沉积物的河流中。我们的结果表明,三角洲决口位置由洪水驱动的侵蚀上游范围决定,通常限于回水区,但在陡峭、富含沉积物的河流中可以延伸至上游很远。我们的发现阐明了决口灾害可能如何响应土地利用和气候变化。',
]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
评估
指标
交叉编码器重排序
- 数据集:
climate-science-eval
- 使用
CrossEncoderRerankingEvaluator
进行评估,参数如下:{ "at_k": 10, "always_rerank_positives": true }
指标 | 值 |
---|---|
map | 0.6629 (+0.4483) |
mrr@10 | 0.6554 (+0.4475) |
ndcg@10 | 0.7068 (+0.4669) |
训练详情
训练数据集
未命名数据集
- 大小: 263,476 训练样本
- 列:
query
,answer
, 和label
- 基于前1000个样本的近似统计:
query answer label type string string int details - min: 55 字符
- mean: 178.19 字符
- max: 593 字符
- min: 13 字符
- mean: 1510.36 字符
- max: 29945 字符
- 0: ~74.40%
- 1: ~25.60%
- 样本:
query answer label 研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。
当前,人们重新对利用巨大的潮汐资源以应对气候变化和能源安全双重挑战产生了兴趣。然而,在英国,没有一项潮汐拦河坝提案通过开发阶段,这是由于高成本和环境问题的综合影响。本文展示了如何将框架(如西北水电资源模型)应用于潮汐拦河坝,并以默西河拦河坝为案例研究。该模型的实现旨在为开发者提供一个工具,以成功识别特定位置水电方案的容量。资源模型的一个关键特征是理解到小型水电利用的障碍不是单一的,而是多个障碍共同阻碍了开发。因此,本文部分贡献于对潮汐拦河坝的全面整体处理,认识到除了能源生产外,其他环境、社会和经济机会也会出现,必须进行全面调查以进行稳健的决策。本研究展示了如何考虑人们的社会需求和补偿栖息地的必要性,例如,开发了一种有机建筑设计,旨在增强而非削弱默西河...
1
研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。
彩虹通过提供与自然的启发式联系,为人类福祉做出贡献。由于彩虹是一种大气光学现象,由阳光通过雨滴折射产生,人为气候强迫导致的降水和云量变化将改变彩虹的分布。然而,我们对彩虹当前的空间分布以及气候变化可能如何改变这一模式缺乏基本理解。为了评估气候变化可能如何影响彩虹观赏机会,我们开发了一个全球众包拍摄彩虹的数据库,训练了一个彩虹出现的经验模型,并将该模型应用于当前气候和三种未来气候情景。结果表明,目前地球上平均每个陆地位置每年有117 ± 71天具备适合彩虹的条件。到2100年,气候变化可能会使全球年平均彩虹日(即至少出现一次彩虹的日子)净增加4.0–4.9 %,在最高排放情景下变化最大。约21–34 %的陆地面积将失去彩虹日,66–79 %将获得彩虹日,彩虹增加的热点主要位于人口较少的高纬度和高海拔地区。我们的研究表明,气候变化对非有形环境属性的改变可能是显著的,值得考虑和缓解...
0
研究人员表示,通过适当设计,默西河拦河坝有潜力成为全球可识别的建筑基础设施——一个提升该地区旅游业的'水电地标'。
恐龙成为陆地生态系统主导成分的崛起是生命历史上的一个关键事件,然而其早期进化和生物多样性的驱动因素尚不清楚。1Brusatte S.L. Benton M.J. Ruta M. Lloyd G.T. 恐龙进化的前50 Myr:宏观进化模式和形态差异.Biol. Lett. 2008; 4: 733-736https://doi.org/10.1098/rsbl.2008.0441Crossref PubMed Scopus (105) Google Scholar,2Irmis R.B. 评估恐龙早期多样化的假设.Earth Environ. Sci. Trans. R. Soc. Edinb. 2010; 101: 397-426https://doi.org/10.1017/S1755691011020068Crossref Scopus (94) Google Scholar,3Benton M.J. Forth J. Langer M.C. 恐龙崛起的模型.Curr. Biol. 2014; 24: R87-R95https://doi.org/10.1016/j.cub.2013.11.063Abstract Full Text Full Text PDF PubMed Scopus (93) Google Scholar 在晚三叠纪的早期多样化过程中,恐龙最初稀少且地理分布受限,仅...
0
- 损失函数:
BinaryCrossEntropyLoss
,参数如下:{ "activation_fn": "torch.nn.modules.linear.Identity", "pos_weight": 6 }
训练超参数
非默认超参数
eval_strategy
: stepsper_device_train_batch_size
: 16per_device_eval_batch_size
: 16learning_rate
: 2e-05warmup_ratio
: 0.1fp16
: Truedataloader_num_workers
: 4load_best_model_at_end
: True
所有超参数
点击展开
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 3max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 4- `datal
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文