A

All Mpnet Base V2

由 diptanuc 开发
基于MPNet架构的句子嵌入模型,可将文本映射到768维向量空间,适用于语义搜索和文本相似度任务
下载量 138
发布时间 : 4/23/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个句子转换器,能够将句子和段落转换为密集向量表示,适用于聚类、语义搜索等自然语言处理任务。

模型特点

高质量句子嵌入
在超过10亿句子对上进行训练,产生高质量的句子向量表示
对比学习训练
采用对比学习目标,使相似句子在向量空间中更接近
多数据集融合
融合了20多个不同来源的数据集进行训练,增强了模型的泛化能力

模型能力

句子向量化
语义相似度计算
文本聚类
信息检索
问答系统支持

使用案例

信息检索
语义搜索
将查询和文档转换为向量,实现基于语义而非关键词的搜索
提高搜索结果的相关性
文本分析
文档聚类
将相似文档分组,用于主题建模或内容组织
自动发现文档集合中的主题结构
问答系统
问题匹配
识别用户问题与知识库中已有问题的语义相似度
提高问答系统的准确率