NV-Embed-v2开源嵌入模型 - 多自然语言处理任务适用，基准测试表现佳

首页

NV Embed V2

由 nvidia 开发

NV-Embed-v2 是一个基于 sentence-transformers 的嵌入模型，在多个 MTEB 基准测试中表现出色，适用于多种自然语言处理任务。

文本嵌入

Transformers

英语#高精度文本分类 #多任务嵌入 #语义检索优化

下载量 35.55k

发布时间 : 8/29/2024

模型简介

该模型主要用于文本嵌入和相似度计算，支持分类、聚类、检索和重排序等多种任务。

模型特点

高性能文本嵌入

在多个 MTEB 基准测试中表现出色，特别是在分类和检索任务中。

多任务支持

支持多种自然语言处理任务，包括分类、聚类、检索和重排序。

高准确率

在 AmazonCounterfactualClassification 和 AmazonPolarityClassification 任务中分别达到 94.28% 和 97.74% 的准确率。

模型能力

文本分类

文本聚类

信息检索

重排序

文本相似度计算

使用案例

电子商务

产品评论分类

用于对亚马逊产品评论进行分类，识别正面和负面评价。

在 AmazonPolarityClassification 任务中达到 97.74% 的准确率。

反事实评论检测

检测亚马逊上的反事实评论，帮助识别虚假或误导性内容。

在 AmazonCounterfactualClassification 任务中达到 94.28% 的准确率。

学术研究

论文聚类

对 arXiv 和 bioRxiv 上的学术论文进行聚类，帮助研究人员发现相关研究。

在 ArxivClusteringP2P 和 BiorxivClusteringP2P 任务中分别达到 55.80% 和 54.09% 的 v_measure 分数。

技术支持

重复问题检测

在 AskUbuntu 社区中检测重复的技术问题，提高支持效率。

在 AskUbuntuDupQuestions 任务中达到 67.46% 的 map 分数。

🚀 NV-Embed-v2

NV-Embed-v2 是一个在自然语言处理领域表现出色的模型，它在多个 MTEB 数据集上进行了测试，涵盖分类、检索、聚类、重排序和语义文本相似度等多种任务，展现出了优秀的性能。

📚 详细文档

模型评估结果

数据集名称	任务类型	主要得分
MTEB AmazonCounterfactualClassification (en)	Classification	94.28358208955224
MTEB AmazonPolarityClassification	Classification	97.74185000000001
MTEB AmazonReviewsClassification (en)	Classification	63.96000000000001
MTEB ArguAna	Retrieval	70.074
MTEB ArxivClusteringP2P	Clustering	55.79933795955242
MTEB ArxivClusteringS2S	Clustering	51.262845995850334
MTEB AskUbuntuDupQuestions	Reranking	67.46477327480808
MTEB BIOSSES	STS	87.41644967443246
MTEB Banking77Classification	Classification	92.41558441558443
MTEB BiorxivClusteringP2P	Clustering	54.08649516394218
MTEB BiorxivClusteringS2S	Clustering	49.60352214167779
MTEB CQADupstackRetrieval	Retrieval	50.24175000000001
MTEB ClimateFEVER	Retrieval	45.388
MTEB DBPedia	Retrieval	53.496
MTEB EmotionClassification	Classification	93.38499999999999
MTEB FEVER	Retrieval	93.74900000000001
MTEB FiQA2018	Retrieval	65.729
MTEB HotpotQA	Retrieval	85.479
MTEB ImdbClassification	Classification	97.1376
MTEB MSMARCO	Retrieval	45.629999999999995
MTEB MTOPDomainClassification (en)	Classification	99.24988600091199
MTEB MTOPIntentClassification (en)	Classification	94.3684450524396
MTEB MassiveIntentClassification (en)	Classification	86.09616677874916
MTEB MassiveScenarioClassification (en)	Classification	92.17215870880968
MTEB MedrxivClusteringP2P	Clustering	46.09497344077905
MTEB MedrxivClusteringS2S	Clustering	44.861049989560684
MTEB MindSmallReranking	Reranking	31.75936162919999
MTEB NFCorpus	Retrieval	45.174
MTEB NQ	Retrieval	73.568
MTEB QuoraRetrieval	Retrieval	89.035
MTEB RedditClustering	Clustering	71.0984522742521
MTEB RedditClusteringP2P	Clustering	74.94499641904133
MTEB SCIDOCS	Retrieval	21.901
MTEB SICK-R	STS	82.14763206055602
MTEB STS12	STS	77.89286260403269
MTEB STS13	STS	88.30238972017452
MTEB STS14	STS	84.29920990970672
MTEB STS15	STS	89.03555007807218
MTEB STS16	STS	86.77353371581373
MTEB STS17 (en-en)	STS	90.66976712249057
MTEB STS22 (en)	STS	68.11632448161046
MTEB STSBenchmark	STS	88.40520383147418
MTEB SciDocsRR	Reranking	87.58627126942797
MTEB SciFact	Retrieval	80.12700000000001
MTEB SprintDuplicateQuestions	PairClassification	99.87623762376238
MTEB StackExchangeClustering	Clustering	82.10134099988541
MTEB StackExchangeClusteringP2P	Clustering	48.357450742397404
MTEB StackOverflowDupQuestions

部分数据集详细指标

MTEB AmazonCounterfactualClassification (en)

指标类型	值
accuracy	94.28358208955224
accuracy_stderr	0.40076780842082305
ap	76.49097318319616
ap_stderr	1.2418692675183929
f1	91.41982003001168
f1_stderr	0.5043921413093579
main_score	94.28358208955224

MTEB ArguAna

指标类型	值
map_at_1	46.515
map_at_10	62.392
map_at_100	62.732
map_at_1000	62.733000000000004
map_at_3	58.701
map_at_5	61.027
mrr_at_1	0.0
mrr_at_10	0.0
mrr_at_100	0.0
mrr_at_1000	0.0
mrr_at_3	0.0
mrr_at_5	0.0
ndcg_at_1	46.515
ndcg_at_10	70.074
ndcg_at_100	71.395
ndcg_at_1000	71.405
ndcg_at_3	62.643
ndcg_at_5	66.803
precision_at_1	46.515
precision_at_10	9.41
precision_at_100	0.996
precision_at_1000	0.1
precision_at_3	24.68
precision_at_5	16.814
recall_at_1	46.515
recall_at_10	94.097
recall_at_100	99.57300000000001
recall_at_1000	99.644
recall_at_3	74.03999999999999
recall_at_5	84.068
main_score	70.074