B

Bge Small En V1.5 Gguf

由 CompendiumLabs 开发
提供GGUF格式的量化与非量化嵌入模型,专为llama.cpp设计,性能优于transformers,在CPU上能显著提速
下载量 710
发布时间 : 2/17/2024
模型介绍
内容详情
替代品

模型简介

BGE小型英文嵌入模型的GGUF格式版本,适用于文本嵌入任务,支持多种量化级别

模型特点

GGUF格式优化
专为llama.cpp设计,相比原始transformers实现有显著性能提升
多重量化选项
提供从F32到Q4_K_M多种量化级别,平衡速度与精度
CPU高效运行
在CPU上可实现高达30%的速度提升,量化后精度损失极小

模型能力

文本嵌入
语义相似度计算
信息检索

使用案例

搜索与检索
文档相似度搜索
计算文档间的语义相似度
高效找到相关内容
自然语言处理
语义分析
提取文本的语义表示
用于下游NLP任务