S

Scincl

由 malteos 开发
SciNCL是一个预训练的BERT语言模型,用于生成研究论文的文档级嵌入表示,利用引文图的邻域关系进行对比学习训练。
下载量 6,744
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于科学文献的嵌入表示生成,通过对比学习优化文档级语义表示,适用于学术论文相似性计算和推荐系统。

模型特点

引文图增强训练
利用S2ORC引文图的邻域关系生成对比学习样本,提升文档表示质量
科学领域优化
专为科学文献设计,在SciDocs评估基准上表现优异
双文本编码
支持标题与摘要的联合编码(通过[SEP]标记连接)

模型能力

科学文献嵌入表示生成
文档相似度计算
学术论文推荐

使用案例

学术研究
相关论文发现
通过嵌入相似度查找与给定论文相关的研究文献
在SciDocs评估中引用关系任务达到93.6 map
学术推荐系统
构建基于内容的论文推荐系统
推荐任务达到54.3 ndcg
文献分析
研究趋势分析
通过大规模文献嵌入聚类分析学科发展脉络