B

Bge M3 Distill 8l

由 altaidevorg 开发
从BAAI/bge-m3蒸馏得到的8层嵌入模型,在保持检索性能的同时实现2.5倍速度提升
下载量 249
发布时间 : 1/19/2025
模型介绍
内容详情
替代品

模型简介

该模型通过知识蒸馏技术将原24层模型压缩至8层,参数量3.66亿,适用于语义相似度计算和检索任务

模型特点

高效压缩
从24层蒸馏至8层,参数量减少67%,推理速度提升2.5倍
性能保留
在STS测试集上保持0.965的斯皮尔曼余弦相似度,与原模型差异可忽略
长文本支持
最大支持8192个token的序列长度,适合处理长文档
跨语言能力
虽以土耳其语数据为主,但在英语等语言上仍表现优异

模型能力

语义相似度计算
文本嵌入生成
跨语言文本检索
长文本处理

使用案例

信息检索
语义搜索系统
构建基于语义匹配的搜索引擎
提升搜索结果的相关性
推荐系统
内容推荐
基于内容相似度的推荐引擎
提高推荐准确率
RAG应用
检索增强生成
为LLM提供相关上下文检索
提升生成内容的相关性