模型介绍
内容详情
替代品
模型简介
这是BGE-large-en-v1.5嵌入模型的量化版本,使用Sparsify进行量化优化,并通过DeepSparseSentenceTransformers实现推理加速。适用于需要高效文本嵌入的场景。
模型特点
高效推理
通过DeepSparse在10核笔记本电脑上实现4.8倍延迟提升,在16核AWS实例上实现3.5倍提升
量化优化
使用Sparsify进行INT8量化,保持模型性能的同时减少计算资源需求
多任务支持
支持语义文本相似度、文本分类和对分类等多种自然语言处理任务
模型能力
文本嵌入生成
语义相似度计算
文本分类
句子对分类
使用案例
文本相似度
文档检索
计算文档间的语义相似度,用于信息检索系统
在STS基准测试中达到86.6%的余弦相似度皮尔逊相关系数
重复问题检测
识别语义相似的重复问题
在SprintDuplicateQuestions数据集上达到99.85%的准确率
文本分类
情感分析
对文本进行情感倾向分类
在AmazonCounterfactual分类任务上达到75.54%的准确率
许可证: mit
语言:
- 英文
标签: - 稀疏
- 稀疏性
- 量化
- onnx
- 嵌入
- int8
- mteb
- deepsparse
模型索引: - 名称: bge-large-en-v1.5-quant
结果:- 任务:
类型: 分类
数据集:
类型: mteb/amazon_counterfactual
名称: MTEB AmazonCounterfactualClassification (en)
配置: en
拆分: 测试
修订版本: e8379541af4e31359cca9fbcf4b00f2671dba205
指标:- 类型: 准确率
值: 75.53731343283583 - 类型: 平均精度
值: 38.30609312253564 - 类型: F1分数
值: 69.42802757893695
- 类型: 准确率
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/biosses-sts
名称: MTEB BIOSSES
配置: 默认
拆分: 测试
修订版本: d3fb88f8f02e40887cd149695127462bbcf29b4a
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 89.27346145216443 - 类型: 余弦相似度斯皮尔曼相关系数
值: 88.36526647458979 - 类型: 欧氏距离皮尔逊相关系数
值: 86.83053354694746 - 类型: 欧氏距离斯皮尔曼相关系数
值: 87.56223612880584 - 类型: 曼哈顿距离皮尔逊相关系数
值: 86.59250609226758 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 87.70681773644885
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sickr-sts
名称: MTEB SICK-R
配置: 默认
拆分: 测试
修订版本: a6ea5a8cab320b040a23452cc28066d9beae2cee
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 86.18998669716373 - 类型: 余弦相似度斯皮尔曼相关系数
值: 82.06129973984048 - 类型: 欧氏距离皮尔逊相关系数
值: 83.65969509485801 - 类型: 欧氏距离斯皮尔曼相关系数
值: 81.91666612708826 - 类型: 曼哈顿距离皮尔逊相关系数
值: 83.6906794731384 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 81.91752705367436
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts12-sts
名称: MTEB STS12
配置: 默认
拆分: 测试
修订版本: a0d554a64d88156834ff5ae9920b964011b16384
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 86.93407086985752 - 类型: 余弦相似度斯皮尔曼相关系数
值: 78.82992283957066 - 类型: 欧氏距离皮尔逊相关系数
值: 83.39733473832982 - 类型: 欧氏距离斯皮尔曼相关系数
值: 78.86999229850214 - 类型: 曼哈顿距离皮尔逊相关系数
值: 83.39397058098533 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 78.85397971200753
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts13-sts
名称: MTEB STS13
配置: 默认
拆分: 测试
修订版本: 7e90230a92c190f1bf69ae9002b8cea547a64cca
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 87.2586009863056 - 类型: 余弦相似度斯皮尔曼相关系数
值: 87.99415514558852 - 类型: 欧氏距离皮尔逊相关系数
值: 86.98993652364359 - 类型: 欧氏距离斯皮尔曼相关系数
值: 87.72725335668807 - 类型: 曼哈顿距离皮尔逊相关系数
值: 86.897205761048 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 87.65231103509018
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts14-sts
名称: MTEB STS14
配置: 默认
拆分: 测试
修订版本: 6031580fec1f6af667f0bd2da0a551cf4f0b2375
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 85.41417660460755 - 类型: 余弦相似度斯皮尔曼相关系数
值: 83.50291886604928 - 类型: 欧氏距离皮尔逊相关系数
值: 84.67758839660924 - 类型: 欧氏距离斯皮尔曼相关系数
值: 83.4368059512681 - 类型: 曼哈顿距离皮尔逊相关系数
值: 84.66027228213025 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 83.43472054456252
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts15-sts
名称: MTEB STS15
配置: 默认
拆分: 测试
修订版本: ae752c7c21bf194d8b67fd573edf7ae58183cbe3
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 88.02513262365703 - 类型: 余弦相似度斯皮尔曼相关系数
值: 89.00430907638267 - 类型: 欧氏距离皮尔逊相关系数
值: 88.16290361497319 - 类型: 欧氏距离斯皮尔曼相关系数
值: 88.6645154822661 - 类型: 曼哈顿距离皮尔逊相关系数
值: 88.15337528825458 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 88.66202950081507
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts16-sts
名称: MTEB STS16
配置: 默认
拆分: 测试
修订版本: 4d8694f8f0e0100860b497b999b3dbed754a0513
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 85.10194022827035 - 类型: 余弦相似度斯皮尔曼相关系数
值: 86.45367112223394 - 类型: 欧氏距离皮尔逊相关系数
值: 85.45292931769094 - 类型: 欧氏距离斯皮尔曼相关系数
值: 86.06607589083283 - 类型: 曼哈顿距离皮尔逊相关系数
值: 85.4111233047049 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 86.04379654118996
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts17-crosslingual-sts
名称: MTEB STS17 (en-en)
配置: en-en
拆分: 测试
修订版本: af5e6fb845001ecf41f4c1e033ce921939a2a68d
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 89.86966589113663 - 类型: 余弦相似度斯皮尔曼相关系数
值: 89.5617056243649 - 类型: 欧氏距离皮尔逊相关系数
值: 89.018495917952 - 类型: 欧氏距离斯皮尔曼相关系数
值: 88.387335721179 - 类型: 曼哈顿距离皮尔逊相关系数
值: 89.07568042943448 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 88.51733863475219
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/sts22-crosslingual-sts
名称: MTEB STS22 (en)
配置: en
拆分: 测试
修订版本: 6d1ba47164174a496b7fa5d3569dae26a6813b80
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 68.38465344518238 - 类型: 余弦相似度斯皮尔曼相关系数
值: 68.15219488291783 - 类型: 欧氏距离皮尔逊相关系数
值: 68.99169681132668 - 类型: 欧氏距离斯皮尔曼相关系数
值: 68.01334641045888 - 类型: 曼哈顿距离皮尔逊相关系数
值: 68.84952679202642 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 67.85430179655137
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 语义文本相似度(STS)
数据集:
类型: mteb/stsbenchmark-sts
名称: MTEB STSBenchmark
配置: 默认
拆分: 测试
修订版本: b0fddb56ed78048fa8b90373c8a3cfc37b684831
指标:- 类型: 余弦相似度皮尔逊相关系数
值: 86.60574360222778 - 类型: 余弦相似度斯皮尔曼相关系数
值: 87.8878986593873 - 类型: 欧氏距离皮尔逊相关系数
值: 87.11557232168404 - 类型: 欧氏距离斯皮尔曼相关系数
值: 87.40944677043365 - 类型: 曼哈顿距离皮尔逊相关系数
值: 87.10395398212532 - 类型: 曼哈顿距离斯皮尔曼相关系数
值: 87.35977283466168
- 类型: 余弦相似度皮尔逊相关系数
- 任务:
类型: 对分类
数据集:
类型: mteb/sprintduplicatequestions-pairclassification
名称: MTEB SprintDuplicateQuestions
配置: 默认
拆分: 测试
修订版本: d66bd1f72af766a5cc4b0ca5e00c162f89e8cc46
指标:- 类型: 余弦相似度准确率
值: 99.84752475247525 - 类型: 余弦相似度平均精度
值: 96.49316696572335 - 类型: 余弦相似度F1分数
值: 92.35352532274081 - 类型: 余弦相似度精确率
值: 91.71597633136095 - 类型: 余弦相似度召回率
值: 93.0 - 类型: 点积准确率
值: 99.77326732673268 - 类型: 点积平均精度
值: 93.5497681978726 - 类型: 点积F1分数
值: 88.35582208895552 - 类型: 点积精确率
值: 88.31168831168831 - 类型: 点积召回率
值: 88.4 - 类型: 欧氏距离准确率
值: 99.84653465346534 - 类型: 欧氏距离平均精度
值: 96.36378999360083 - 类型: 欧氏距离F1分数
值: 92.33052944087086 - 类型: 欧氏距离精确率
值: 91.38099902056807 - 类型: 欧氏距离召回率
值: 93.30000000000001 - 类型: 曼哈顿距离准确率
值: 99.84455445544555 - 类型: 曼哈顿距离平均精度
值: 96.36035171233175 - 类型: 曼哈顿距离F1分数
值: 92.13260761999011 - 类型: 曼哈顿距离精确率
值: 91.1851126346719 - 类型: 曼哈顿距离召回率
值: 93.10000000000001 - 类型: 最大准确率
值: 99.84752475247525 - 类型: 最大平均精度
值: 96.49316696572335 - 类型: 最大F1分数
值: 92.35352532274081
- 类型: 余弦相似度准确率
- 任务:
类型: 对分类
数据集:
类型: mteb/twittersemeval2015-pairclassification
名称: MTEB TwitterSemEval2015
配置: 默认
拆分: 测试
修订版本: 70970daeab8776df92f5ea462b6173c0b46fd2d1
指标:- 类型: 余弦相似度准确率
值: 87.26828396018358 - 类型: 余弦相似度平均精度
值: 77.79878217023162 - 类型: 余弦相似度F1分数
值: 71.0425694621463 - 类型: 余弦相似度精确率
值: 68.71301775147928 - 类型: 余弦相似度召回率
值: 73.53562005277044 - 类型: 点积准确率
值: 84.01978899684092 - 类型: 点积平均精度
值: 66.12134149171163 - 类型: 点积F1分数
值: 63.283507097098365 - 类型: 点积精确率
值: 60.393191081275475 - 类型: 点积召回率
值: 66.46437994722955 - 类型: 欧氏距离准确率
值: 87.24444179531503 - 类型: 欧氏距离平均精度
值: 77.84821131946212 - 类型: 欧氏距离F1分数
值: 71.30456661215247 - 类型: 欧氏距离精确率
值: 68.1413801394566 - 类型: 欧氏距离召回率
值: 74.77572559366754 - 类型: 曼哈顿距离准确率
值: 87.19079692436074 - 类型: 曼哈顿距离平均精度
值: 77.78054941055291 - 类型: 曼哈顿距离F1分数
值: 71.13002127393318 - 类型: 曼哈顿距离精确率
值: 67.65055939062128 - 类型: 曼哈顿距离召回率
值: 74.9868073878628 - 类型: 最大准确率
值: 87.26828396018358 - 类型: 最大平均精度
值: 77.84821131946212 - 类型: 最大F1分数
值: 71.30456661215247
- 类型: 余弦相似度准确率
- 任务:
类型: 对分类
数据集:
类型: mteb/twitterurlcorpus-pairclassification
名称: MTEB TwitterURLCorpus
配置: 默认
拆分: 测试
修订版本: 8b6510b0b1fa4e4c4f879467980e9be563ec1cdf
指标:- 类型: 余弦相似度准确率
值: 88.91023402025847 - 类型: 余弦相似度平均精度
值: 85.94088151184411 - 类型: 余弦相似度F1分数
值: 78.25673997223645 - 类型: 余弦相似度精确率
值: 74.45433059919367 - 类型: 余弦相似度召回率
值: 82.46843239913767 - 类型: 点积准确率
值: 87.91865564481701 - 类型: 点积平均精度
值: 82.75373957440969 - 类型: 点积F1分数
值: 75.97383507276201 - 类型: 点积精确率
值: 72.67294713160854 - 类型: 点积召回率
值: 79.5888512473052 - 类型: 欧氏距离准确率
值: 88.8539604921023 - 类型: 欧氏距离平均精度
值: 85.71590936389937 - 类型: 欧氏距离F1分数
值: 77.82902261742242 - 类型: 欧氏距离精确率
值: 74.7219270279844 - 类型: 欧氏距离召回率
值: 81.20572836464429 - 类型: 曼哈顿距离准确率
值: 88.78992509799356 - 类型: 曼哈顿距离平均精度
值: 85.70200619366904 - 类型: 曼哈顿距离F1分数
值: 77.85875848203065 - 类型: 曼哈顿距离精确率
值: 72.94315506222671 - 类型: 曼哈顿距离召回率
值: 83.48475515860795 - 类型: 最大准确率
值: 88.91023402025847 - 类型: 最大平均精度
值: 85.94088151184411 - 类型: 最大F1分数
值: 78.25673997223645
- 类型: 余弦相似度准确率
- 任务:
bge-large-en-v1.5-quant

DeepSparse 能够在10核笔记本电脑上将延迟性能提升4.8倍,在16核AWS实例上提升高达3.5倍。
使用方法
这是 bge-large-en-v1.5 嵌入模型的量化(INT8)ONNX变体,使用 Sparsify 进行量化优化,并通过 DeepSparseSentenceTransformers 进行推理加速。
pip install -U deepsparse-nightly[sentence_transformers]
from deepsparse.sentence_transformers import DeepSparseSentenceTransformer
model = DeepSparseSentenceTransformer('neuralmagic/bge-large-en-v1.5-quant', export=False)
# 需要编码的句子
sentences = ['This framework generates embeddings for each input sentence',
'Sentences are passed as a list of string.',
'The quick brown fox jumps over the lazy dog.']
# 通过调用 model.encode() 编码句子
embeddings = model.encode(sentences)
# 打印嵌入向量
for sentence, embedding in zip(sentences, embeddings):
print("句子:", sentence)
print("嵌入向量:", embedding.shape)
print("")
如有关于这些模型和稀疏化方法的一般问题,请通过我们的 社区Slack 联系工程团队。
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文