all-mpnet-base-v2-embedding-all开源句子嵌入模型 - 免费部署助你完成句子相似度任务

首页

All Mpnet Base V2 Embedding All

由 LLukas22 开发

基于sentence-transformers/all-mpnet-base-v2微调的句子嵌入模型，适用于句子相似度任务

文本嵌入

Transformers

英语开源协议:Apache-2.0 #多领域问答嵌入 #高精度语义匹配 #混合数据集微调

下载量 45

发布时间 : 2/23/2023

模型简介

本模型是基于多个问答和文档数据集微调的句子嵌入模型，主要用于生成句子的向量表示，以便计算句子之间的相似度。

模型特点

多数据集微调

基于squad、newsqa等多个问答和文档数据集进行微调，增强了模型的泛化能力

高效训练

使用AdamW优化器和混合精度训练(bf16)，提高了训练效率

性能优化

通过15轮训练和验证损失监控，确保模型性能稳定提升

模型能力

句子向量化

句子相似度计算

文本特征提取

使用案例

信息检索

问答系统

用于检索与问题最相关的答案段落

在评估数据集中，top_1准确率达到38.5%

文档相似度匹配

查找相似文档或段落

在评估数据集中，top_25准确率达到58.4%

🚀 all-mpnet-base-v2-embedding-all

该模型是 all-mpnet-base-v2 在以下数据集上的微调版本：squad、newsqa、LLukas22/cqadupstack、LLukas22/fiqa、LLukas22/scidocs、deepset/germanquad、LLukas22/nq。它可用于句子相似度计算等任务，为相关自然语言处理应用提供支持。

🚀 快速开始

当你安装了 sentence-transformers 后，使用该模型会变得很简单。

📦 安装指南

pip install -U sentence-transformers

💻 使用示例

基础用法

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('LLukas22/all-mpnet-base-v2-embedding-all')
embeddings = model.encode(sentences)
print(embeddings)

🔧 技术细节

训练超参数

训练过程中使用了以下超参数：

学习率：1E+00
每个设备的批量大小：60
有效批量大小：180
随机种子：42
优化器：AdamW，β值为 (0.9,0.999)，ε值为 1E-08
权重衰减：2E-02
D-Adaptation：True
预热：True
训练轮数：15
混合精度训练：bf16

训练结果

轮数	训练损失	验证损失
0	0.0554	0.047
1	0.044	0.0472
2	0.0374	0.0425
3	0.0322	0.041
4	0.0278	0.0403
5	0.0246	0.0389
6	0.0215	0.0389
7	0.0192	0.0388
8	0.017	0.0379
9	0.0154	0.0375
10	0.0142	0.0381
11	0.0132	0.0372
12	0.0126	0.0377
13	0.012	0.0377

评估结果

轮数	前1准确率	前3准确率	前5准确率	前10准确率	前25准确率
0	0.373	0.476	0.509	0.544	0.573
1	0.362	0.466	0.501	0.537	0.568
2	0.371	0.476	0.511	0.546	0.576
3	0.369	0.473	0.506	0.54	0.569
4	0.373	0.478	0.512	0.547	0.578
5	0.378	0.483	0.517	0.552	0.58
6	0.371	0.475	0.509	0.543	0.571
7	0.379	0.484	0.517	0.55	0.578
8	0.378	0.482	0.515	0.548	0.575
9	0.383	0.489	0.523	0.556	0.584
10	0.38	0.483	0.517	0.549	0.575
11	0.38	0.485	0.518	0.551	0.577
12	0.383	0.489	0.522	0.556	0.582
13	0.385	0.49	0.523	0.555	0.581