A

All Datasets V3 Mpnet Base

由 flax-sentence-embeddings 开发
基于MPNet架构的句子嵌入模型,可将文本映射到768维向量空间,适用于语义搜索和句子相似度计算
下载量 3,472
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个句子转换器,能够将句子和段落转换为密集向量表示,适用于信息检索、聚类和语义相似度等任务。

模型特点

高精度语义编码
在10亿句子对数据集上微调,能准确捕捉句子语义信息
768维稠密向量
生成高维向量表示,适合复杂语义分析任务
对比学习训练
采用对比学习目标优化模型,增强句子对区分能力

模型能力

句子向量化
语义相似度计算
信息检索
文本聚类
特征提取

使用案例

信息检索
语义搜索
将查询和文档转换为向量进行相似度匹配
相比传统关键词搜索能获得更相关的结果
文本分析
文档聚类
基于语义相似度对大量文档进行自动分组
可发现文档集合中的主题分布