B

Bge Large En V1.5 Quant

由 RedHatAI 开发
BGE-large-en-v1.5的量化(INT8)ONNX变体,通过DeepSparse进行推理加速
下载量 1,094
发布时间 : 10/3/2023
模型介绍
内容详情
替代品

模型简介

这是BGE-large-en-v1.5嵌入模型的量化版本,使用Sparsify进行量化优化,并通过DeepSparseSentenceTransformers实现推理加速。适用于需要高效文本嵌入的场景。

模型特点

高效推理
通过DeepSparse在10核笔记本电脑上实现4.8倍延迟提升,在16核AWS实例上实现3.5倍提升
量化优化
使用Sparsify进行INT8量化,保持模型性能的同时减少计算资源需求
多任务支持
支持语义文本相似度、文本分类和对分类等多种自然语言处理任务

模型能力

文本嵌入生成
语义相似度计算
文本分类
句子对分类

使用案例

文本相似度
文档检索
计算文档间的语义相似度,用于信息检索系统
在STS基准测试中达到86.6%的余弦相似度皮尔逊相关系数
重复问题检测
识别语义相似的重复问题
在SprintDuplicateQuestions数据集上达到99.85%的准确率
文本分类
情感分析
对文本进行情感倾向分类
在AmazonCounterfactual分类任务上达到75.54%的准确率