S

S Scibert Snli Multinli Stsb

由 pritamdeka 开发
基于sentence-transformers的模型,能够将句子和段落映射到768维稠密向量空间,适用于聚类或语义搜索等任务。
下载量 891
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于SciBERT架构,经过SNLI、MultiNLI和STSB数据集的训练,能够生成高质量的句子嵌入向量,用于句子相似度计算和语义搜索。

模型特点

高质量句子嵌入
能够生成768维的稠密向量表示,捕捉句子的语义信息。
多任务训练
模型在SNLI、MultiNLI和STSB等多个数据集上进行训练,具有更强的泛化能力。
易于集成
通过sentence-transformers库可以轻松集成到现有系统中。

模型能力

句子相似度计算
语义搜索
文本聚类
特征提取

使用案例

信息检索
语义搜索
使用该模型可以构建语义搜索引擎,返回与查询语义相似的结果。
相比传统关键词搜索,能更好地理解用户意图。
文本分析
文档聚类
将相似文档分组,用于内容管理和分析。
基于语义相似度而非表面特征进行更准确的聚类。