halong-embedding-gguf开源句子嵌入模型 - 免费部署助力越南语句子相似度计算

首页

Halong Embedding Gguf

由 doof-ferb 开发

halong_embedding是一个基于hiieu开发的句子嵌入模型，主要用于越南语的句子相似度计算任务。

文本嵌入其他#越南语嵌入 #句子相似度 #多语言支持

下载量 121

发布时间 : 10/3/2024

模型简介

该模型是一个句子嵌入模型，能够将输入的越南语句子转换为高维向量表示，用于计算句子之间的相似度。

模型特点

越南语支持

专门针对越南语优化的句子嵌入模型

高效量化

提供多种量化版本，包括f16、bf16、q8_0、q6_k等多种格式

易于部署

支持GGUF格式，便于在各种环境中部署使用

模型能力

句子向量化

句子相似度计算

越南语文本处理

使用案例

文本检索

越南语文档相似度搜索

用于构建越南语文档的相似度搜索系统

语义分析

越南语语义相似度计算

计算两个越南语句子之间的语义相似度

🚀 `hiieu/halong_embedding`（GGUF格式）

本项目提供了hiieu/halong_embedding模型的GGUF格式转换及使用方法，可用于句子相似度任务，支持越南语。

🚀 快速开始

量化步骤

可通过以下命令将模型转换为GGUF格式并进行量化：

REL=b3827  # 可更改为后续版本
wget https://github.com/ggerganov/llama.cpp/releases/download/$REL/llama-$REL-bin-ubuntu-x64.zip --content-disposition --continue &> /dev/null
wget https://github.com/ggerganov/llama.cpp/archive/refs/tags/$REL.zip                           --content-disposition --continue &> /dev/null
unzip -q llama-$REL-bin-ubuntu-x64.zip
unzip -q llama.cpp-$REL.zip
mv llama.cpp-$REL/* .
rm -r llama.cpp-$REL/ llama-$REL-bin-ubuntu-x64.zip llama.cpp-$REL.zip
pip install -q -r requirements.txt

rm -rf models/tmp/
git clone --depth=1 --single-branch https://huggingface.co/hiieu/halong_embedding models/tmp
huggingface-cli download intfloat/multilingual-e5-base sentencepiece.bpe.model --local-dir models/tmp
python convert_hf_to_gguf.py models/tmp/ --outfile model-f32.gguf --outtype f32

build/bin/llama-quantize model-f32.gguf model-f16.gguf    f16    2> /dev/null
build/bin/llama-quantize model-f32.gguf model-bf16.gguf   bf16   2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q8_0.gguf   q8_0   2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q6_k.gguf   q6_k   2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_m.gguf q5_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_s.gguf q5_k_s 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_m.gguf q4_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_s.gguf q4_k_s 2> /dev/null

rm -rf models/yolo/
mkdir -p models/yolo
mv model-*.gguf models/yolo/
touch models/yolo/README.md
huggingface-cli upload halong-embedding-gguf models/yolo .

使用示例

基础用法

可使用以下命令进行嵌入计算：

build/bin/llama-embedding -m model-q5_k_m.gguf -p "Cô ấy cười nói suốt cả ngày" --embd-output-format array 2> /dev/null

高级用法

可启动服务器进行嵌入服务：

build/bin/llama-server --embedding -c 512 -m model-q5_k_m.gguf

📦 安装指南

在执行量化和使用命令前，请确保已经完成以下依赖安装：

pip install -q -r requirements.txt

📄 许可证

本项目采用CC BY 4.0许可证。

📚 详细文档

原始模型：https://huggingface.co/hiieu/halong_embedding
模型类型：句子相似度
语言支持：越南语（vi）
库名称：sentence-transformers

属性	详情
模型类型	句子相似度
训练数据	未提及
基础模型	hiieu/halong_embedding
库名称	sentence-transformers
许可证	CC BY 4.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文