A

All Mpnet Base V2 Feature Extraction Pipeline

由 questgen 开发
基于MPNet架构的句子嵌入模型,可将文本映射到768维向量空间,适用于语义搜索和句子相似度计算
下载量 78
发布时间 : 5/15/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个句子转换器,能够将句子和段落转换为768维的密集向量表示,适用于信息检索、聚类和语义相似度计算等任务。

模型特点

高效语义编码
能将句子和段落高效编码为768维向量,保留语义信息
大规模训练
在超过10亿句子对的数据集上进行训练,学习丰富的语义关系
对比学习优化
采用对比学习目标进行微调,提高句子相似度判断能力
TPU优化训练
使用7个TPU v3-8进行高效训练,受益于Flax和JAX框架

模型能力

句子向量化
语义相似度计算
信息检索
文本聚类
段落编码

使用案例

信息检索
语义搜索
将查询和文档转换为向量,实现基于语义而非关键词的搜索
提高搜索结果的相关性
文本分析
文档聚类
将相似文档分组,用于主题建模或内容分析
自动发现文档集合中的主题结构
问答系统
问题匹配
计算用户问题与知识库问题的相似度
提高问答系统的准确率