SGPT-Bloom-7b1-msmarco开源模型 - 免费用于句子相似度计算与特征提取

首页

Sgpt Bloom 7b1 Msmarco

由 bigscience 开发

SGPT-Bloom-7b1-msmarco 是一个基于 BLOOM 架构的句子转换器模型，主要用于句子相似度计算和特征提取任务。

大型语言模型

PyTorch

#多语言句子相似度 #高精度文本检索 #跨语言文本匹配

下载量 31

发布时间 : 8/26/2022

模型简介

该模型基于 BLOOM-7b1 架构，专门针对句子相似度和特征提取任务进行了优化。它在 MTEB (Massive Text Embedding Benchmark) 的各种任务上进行了评估，包括分类、聚类、检索和双语文本挖掘等。

模型特点

多语言支持

支持多种语言处理，包括英文、德文、西班牙文、法文、日文和中文等。

多功能任务处理

能够处理多种自然语言处理任务，包括句子相似度计算、特征提取、分类、聚类和检索等。

大规模基准测试

在 MTEB (Massive Text Embedding Benchmark) 的各种任务上进行了全面评估。

模型能力

句子相似度计算

特征提取

文本分类

文本聚类

信息检索

双语文本挖掘

使用案例

电子商务

产品评论分类

对亚马逊等电商平台的产品评论进行分类和分析。

在 MTEB Amazon 评论分类任务中，英文准确率达到 33.86%，德文 29.70%，西班牙文 35.97%，法文 35.92%，日文 27.64%，中文 32.63%

反事实分类

识别和分析电商平台上的反事实评论。

在 MTEB Amazon 反事实分类任务中，英文准确率 68.06%，德文 61.35%，日文 58.23%

学术研究

学术论文聚类

对 arXiv 和 Biorxiv 上的学术论文进行聚类分析。

在 Arxiv 聚类 P2P 任务中 V 度量 44.59，S2S 任务中 38.03；Biorxiv 聚类 P2P 任务中 V 度量 36.03，S2S 任务中 32.48

问答系统

重复问题识别

识别问答平台上的重复问题。

在 AskUbuntu 重复问题重排序任务中，平均精度 59.97%，平均倒数排名 73.18%

跨语言信息检索

双语文本对齐

识别不同语言间的平行文本。

在 BUCC 双语文本挖掘任务中，德-英准确率 54.28%，法-英 97.34%，俄-英 46.05%，中-英 98.10%

🚀 sgpt-bloom-7b1-msmarco

sgpt-bloom-7b1-msmarco 是一个用于句子相似度任务的模型。它在多个自然语言处理任务和数据集上进行了评估，涵盖分类、检索、聚类、重排序和语义文本相似度等任务，展示了在不同语言和场景下的性能表现。

📚 详细文档

模型信息

属性	详情
管道标签	句子相似度
标签	sentence-transformers、feature-extraction、sentence-similarity、mteb
模型名称	sgpt-bloom-7b1-msmarco

评估结果

分类任务

MTEB AmazonCounterfactualClassification：在不同语言（英语、德语、扩展英语、日语）的测试集上进行了评估，评估指标包括准确率（accuracy）、平均精度（ap）和 F1 值（f1）。
MTEB AmazonPolarityClassification：在测试集上进行评估，指标有准确率、平均精度和 F1 值。
MTEB AmazonReviewsClassification：在多种语言（英语、德语、西班牙语、法语、日语、中文）的测试集上评估，指标包括准确率和 F1 值。
MTEB Banking77Classification：在测试集上评估，指标有准确率和 F1 值。

检索任务

MTEB ArguAna：在测试集上评估，指标包括不同召回率下的平均准确率（map_at_）、平均倒数排名（mrr_at_）、归一化折损累积增益（ndcg_at_）、准确率（precision_at_）和召回率（recall_at_*）。
MTEB CQADupstack 系列：包括 Android、English、Gaming、Gis、Mathematica、Physics、Programmers 等不同领域的检索任务，在测试集上评估，指标与 ArguAna 类似。

聚类任务

MTEB ArxivClusteringP2P 和 MTEB ArxivClusteringS2S：在测试集上评估，指标为 V 测度（v_measure）。
MTEB BiorxivClusteringP2P 和 MTEB BiorxivClusteringS2S：在测试集上评估，指标为 V 测度。

重排序任务

MTEB AskUbuntuDupQuestions：在测试集上评估，指标包括平均准确率（map）和平均倒数排名（mrr）。

语义文本相似度任务

MTEB BIOSSES：在测试集上评估，指标包括余弦相似度的皮尔逊相关系数（cos_sim_pearson）、余弦相似度的斯皮尔曼相关系数（cos_sim_spearman）、欧几里得距离的皮尔逊相关系数（euclidean_pearson）、欧几里得距离的斯皮尔曼相关系数（euclidean_spearman）、曼哈顿距离的皮尔逊相关系数（manhattan_pearson）和曼哈顿距离的斯皮尔曼相关系数（manhattan_spearman）。

双语挖掘任务

MTEB BUCC：在不同语言对（德语 - 英语、法语 - 英语、俄语 - 英语、中文 - 英语）的测试集上评估，指标包括准确率（accuracy）、F1 值（f1）、准确率（precision）和召回率（recall）。

以下是部分任务的详细评估结果示例：

任务类型	数据集	指标	值
分类	MTEB AmazonCounterfactualClassification (en)	准确率	68.05970149253731
分类	MTEB AmazonCounterfactualClassification (en)	平均精度	31.640363460776193
分类	MTEB AmazonCounterfactualClassification (en)	F1 值	62.50025574145796
检索	MTEB ArguAna	map_at_1	23.684
检索	MTEB ArguAna	map_at_10	38.507999999999996
聚类	MTEB ArxivClusteringP2P	V 测度	44.59375023881131
重排序	MTEB AskUbuntuDupQuestions	平均准确率	59.97321570342109
语义文本相似度	MTEB BIOSSES	余弦相似度皮尔逊相关系数	89.09091435741429
双语挖掘	MTEB BUCC (de - en)	准确率	54.27974947807933