H

Halong Embedding

由 hiieu 开发
专注于RAG(检索增强生成)和生产效率的越南语文本嵌入模型,基于intfloat/multilingual-e5-base微调
下载量 7,651
发布时间 : 7/6/2024
模型介绍
内容详情
替代品

模型简介

Halong Embedding是一款基于intfloat/multilingual-e5-base微调的sentence-transformers模型,专注于越南语文本嵌入,支持语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

Matryoshka嵌入
采用Matryoshka损失函数训练,允许截断嵌入向量而性能损失最小,提供更快的比较速度。
多语言支持
以越南语为主,同时支持多语言处理。
高效检索
专注于RAG(检索增强生成)和生产效率,优化了信息检索性能。

模型能力

语义文本相似度计算
语义搜索
复述挖掘
文本分类
聚类分析

使用案例

信息检索
法律文档检索
在Zalo法律检索数据集上评估模型性能,用于快速查找相关法律文档。
准确率@1达到0.8294,准确率@10达到0.9687
健康领域问答
健康益处查询
检索与健康益处相关的足球信息。
相关文档按余弦相似度排序,最高相似度0.7318