D

Declutr Sci Base

由 johngiorgi 开发
基于SciBERT的科学文本句子编码器,通过自监督学习在200万篇科学论文上训练
下载量 50
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个专门针对科学文本优化的句子编码器,能够将句子转换为高维向量表示,用于计算句子相似度等任务。

模型特点

科学文本优化
专门针对科学文献进行预训练,在科学领域文本上表现优异
自监督学习
采用DeCLUTR自监督训练策略,无需标注数据
句子级嵌入
能够将整个句子编码为固定长度的向量表示

模型能力

句子嵌入
语义相似度计算
科学文本特征提取

使用案例

学术研究
文献检索
通过语义相似度查找相关科学文献
提高检索准确性和相关性
论文推荐
基于内容相似度推荐相关研究论文
文本分析
科学文本聚类
将相似的科学论文摘要分组