A

All Mpnet Base V2 Feature Extraction

由 guidecare 开发
基于MPNet架构的句子嵌入模型,可将文本映射到768维向量空间,适用于语义搜索和文本相似度任务
下载量 4,539
发布时间 : 6/23/2022
模型介绍
内容详情
替代品

模型简介

这是一个句子转换器模型,能够将句子和段落转换为768维的密集向量表示,支持聚类、语义搜索等自然语言处理任务。

模型特点

高精度语义编码
在10亿句对数据集上微调,能准确捕捉句子语义信息
768维稠密向量
输出高维向量表示,适合下游机器学习任务
大规模预训练
基于microsoft/mpnet-base模型,在超大规模数据集上微调

模型能力

文本向量化
语义相似度计算
信息检索
文本聚类
句子级特征提取

使用案例

信息检索
文档搜索
将查询和文档转换为向量后计算相似度
实现基于语义而非关键词的搜索
文本分析
文本聚类
对大量文本进行自动分组
发现文本集合中的主题分布