S

Scibert Nli

由 gsarti 开发
基于SciBERT模型,通过SNLI和MultiNLI数据集微调,用于生成通用句子嵌入的模型
下载量 13.77k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于SciBERT架构,通过自然语言推理数据集微调,能够生成高质量的句子嵌入,适用于科学文本处理任务。

模型特点

科学文本优化
使用SciBERT作为基础模型,专门针对科学文本进行了优化
高效训练
在NVIDIA Tesla P100 GPU上仅需约4小时即可完成训练
平均池化策略
采用平均池化策略生成句子嵌入,提高表示能力

模型能力

句子嵌入生成
文本相似度计算
科学文本处理

使用案例

信息检索
科学论文检索
基于相似性的科学论文检索系统
在Covid Papers Browser项目中得到应用
文本分析
句子相似度计算
计算两个科学文本句子之间的语义相似度
在STS数据集上达到74.50的Spearman相关系数