A

All Mpnet Base V2

由 3gg 开发
基于MPNet架构的句子嵌入模型,将文本映射到384维向量空间,适用于语义搜索和句子相似度任务
下载量 15
发布时间 : 5/9/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个句子转换器,能够将句子和段落转换为384维的密集向量表示,可用于聚类、语义搜索等自然语言处理任务。

模型特点

高质量句子嵌入
在10亿句子对上进行微调,生成高质量的句子向量表示
对比学习训练
采用对比学习目标,使相似句子在向量空间中更接近
大规模预训练
基于microsoft/mpnet-base模型进行预训练,具有强大的语义理解能力

模型能力

句子向量化
语义相似度计算
信息检索
文本聚类
特征提取

使用案例

信息检索
语义搜索
使用句子嵌入进行文档检索,匹配查询的语义而非关键词
文本分析
文本聚类
将相似内容的文档自动分组
重复检测
识别语义相似的文档或句子