X

XYZ Embedding Zh

由 fangxq 开发
XYZ-embedding-zh 是一个基于 sentence-transformers 的中文嵌入模型,能够将句子和段落映射到1792维的密集向量空间,适用于聚类和语义搜索等任务。
下载量 22
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

该模型专门为中文文本设计,能够高效地将文本转换为高维向量表示,支持多种自然语言处理任务,如信息检索、重排序等。

模型特点

高维向量表示
将句子和段落映射到1792维的密集向量空间,捕捉丰富的语义信息。
多任务支持
支持多种任务,包括句子相似度计算、特征提取、重排序和信息检索。
中文优化
专门针对中文文本进行优化,能够更好地处理中文语义。

模型能力

句子相似度计算
特征提取
文本重排序
信息检索

使用案例

信息检索
医疗问答检索
在医疗问答数据集中进行信息检索,帮助用户快速找到相关答案。
在 MTEB Cmedqa检索 数据集上,map_at_10 达到 41.228。
电商产品检索
在电商平台上进行产品检索,提升用户搜索体验。
在 MTEB 电商检索 数据集上,ndcg_at_10 达到 69.719。
文本重排序
医疗问答重排序
对医疗问答结果进行重排序,提升答案的相关性。
在 MTEB CMedQAv1 数据集上,map 达到 89.618。
通用文本重排序
对通用文本检索结果进行重排序,优化搜索结果。
在 MTEB T2重排序 数据集上,map 达到 69.066。