A

All Mpnet Base Questions Clustering En

由 aiknowyou 开发
基于sentence-transformers的句子嵌入模型,专为问题聚类任务优化,支持英文文本的语义相似度计算
下载量 45
发布时间 : 9/13/2022
模型介绍
内容详情
替代品

模型简介

该模型能够将句子和段落映射到768维稠密向量空间,适用于聚类或语义搜索等任务。通过融合Quora、WikiAnswer和StackExchange三大公开数据集微调,显著提升了识别语义相似问题的能力。

模型特点

问题聚类优化
专门针对问题聚类任务微调,在识别语义相似问题方面表现优异
多数据集融合训练
融合Quora、WikiAnswer和StackExchange三大公开数据集进行训练
高效语义编码
能将句子和段落高效映射到768维稠密向量空间

模型能力

句子嵌入
语义相似度计算
问题聚类
特征提取

使用案例

问答系统
相似问题识别
识别用户提出的问题是否与已有问题语义相似
在WikiAnswer测试集上达到99.3%的余弦相似度准确率
问题聚类
将语义相似的问题自动归类
信息检索
语义搜索
基于语义而非关键词匹配的搜索系统