bge-large-zh-v1.5-gguf开源嵌入模型 - 适配llama.cpp，CPU提速且精度损失小

首页

Bge Large Zh V1.5 Gguf

由 CompendiumLabs 开发

以GGUF格式提供的BAAI/bge-large-zh-v1.5量化与非量化嵌入模型，适用于llama.cpp，在CPU上能显著提速且精度损失极小。

文本嵌入开源协议:MIT #中文文本嵌入 #高效CPU推理 #GGUF量化

下载量 1,213

发布时间 : 2/17/2024

模型简介

这是一个中文文本嵌入模型，提供多种量化版本，适用于文本相似度计算、信息检索等任务。

模型特点

多种量化选择

提供F32、F16、Q8_0和Q4_K_M四种量化版本，满足不同场景需求

CPU性能优化

在CPU上能实现高达30%的速度提升，同时保持高精度

llama.cpp兼容

专为llama.cpp优化，比原生transformers实现更具优势

模型能力

文本嵌入

语义相似度计算

信息检索

使用案例

信息检索

文档搜索

用于构建高效的文档检索系统

语义分析

文本相似度计算

计算两段中文文本的语义相似度

文件名	量化方式	大小
bge-large-zh-v1.5-f32.gguf	F32	1.3 GB
bge-large-zh-v1.5-f16.gguf	F16	620 MB
bge-large-zh-v1.5-q8_0.gguf	Q8_0	332 MB
bge-large-zh-v1.5-q4_k_m.gguf	Q4_K_M	193 MB

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Bge Large Zh V1.5 Gguf

模型简介

模型特点

模型能力

使用案例

🚀 bge-large-zh-v1.5-gguf

🚀 快速开始

文件列表

使用示例

基础用法

📄 许可证