gte-small-Q8_0-GGUF开源句子嵌入模型 - 免费部署处理句子相似度任务

Gte Small Q8 0 GGUF

由 ggml-org 开发

GTE-small 是一个高效的句子嵌入模型，基于 thenlper/gte-small 基础模型，专注于句子相似度任务。

下载量 66

发布时间 : 2/6/2025

模型简介

该模型主要用于生成高质量的句子嵌入，适用于文本相似度计算、信息检索和聚类等任务。

高效性能

在多个基准测试中表现出色，尤其是在分类和检索任务中。

多任务支持

支持多种自然语言处理任务，包括分类、聚类、检索和句子相似度。

轻量级

作为小型模型，适合资源有限的环境部署。

句子嵌入生成

文本相似度计算

信息检索

文本分类

文本聚类

电子商务

产品评论分类

对亚马逊产品评论进行情感分类。

在 MTEB AmazonPolarityClassification 测试中准确率达到 91.82%。

反事实评论检测

识别亚马逊上的反事实评论。

在 MTEB AmazonCounterfactualClassification 测试中准确率达到 73.22%。

学术研究

论文聚类

对 arXiv 和 bioRxiv 论文进行主题聚类。

在 MTEB ArxivClusteringP2P 测试中 V-measure 达到 47.90%。

问答系统

重复问题识别

在 AskUbuntu 社区识别重复问题。

在 MTEB AskUbuntuDupQuestions 测试中平均精度达到 61.72%。

任务类型	数据集名称	评估指标	值
Classification	MTEB AmazonCounterfactualClassification (en)	accuracy	73.22388059701493
Classification	MTEB AmazonCounterfactualClassification (en)	ap	36.09895941426988
Classification	MTEB AmazonCounterfactualClassification (en)	f1	67.3205651539195
...	...	...	...