S

Sbert Roberta Large Anli Mnli Snli

由 usc-isi 开发
基于RoBERTa-large的句子转换模型,专为句子相似度任务设计,在ANLI、MNLI和SNLI数据集上训练
下载量 38
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型能将句子和段落映射到768维向量空间,适用于语义搜索、聚类等自然语言处理任务

模型特点

高质量句子嵌入
基于RoBERTa-large架构,生成高质量的句子嵌入表示
多数据集训练
在ANLI、MNLI和SNLI三个权威自然语言推理数据集上联合训练
高效池化策略
采用均值池化方法,有效聚合词嵌入信息

模型能力

句子向量化
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
语义搜索系统
构建基于语义而非关键词的搜索系统
提高搜索结果的相关性
文本分析
文档聚类
将语义相似的文档自动分组
实现无监督的文档组织
自然语言理解
句子相似度计算
计算两个句子之间的语义相似度
可用于问答系统、复述检测等应用