C

Conan Embedding V1 Q4 K M GGUF

由 lagoon999 开发
Conan-embedding-v1是由腾讯BAC团队开发的中文文本嵌入模型,基于sentence-transformers库实现,适用于多种中文自然语言处理任务。
下载量 30
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于中文文本的嵌入表示生成,支持语义相似度计算、文本分类、聚类、检索和重排序等多种任务,在多个中文基准测试中表现出色。

模型特点

多任务支持
支持多种中文NLP任务,包括语义相似度计算、文本分类、聚类、检索和重排序等。
高性能
在多个中文基准测试中表现优异,特别是在医疗领域相关任务上表现突出。
中文优化
专门针对中文文本进行优化,能够更好地捕捉中文语义特征。

模型能力

文本嵌入生成
语义相似度计算
文本分类
文本聚类
信息检索
搜索结果重排序

使用案例

医疗领域
医疗问答检索
用于医疗相关问题的检索系统,帮助用户快速找到相关医疗信息。
在CMedQA检索任务中,map@100达到42.495
医疗文档重排序
对医疗文档检索结果进行相关性重排序,提升用户体验。
在CMedQAv1重排序任务中,mrr达到93.358
电子商务
商品评论分类
对电商平台的商品评论进行情感和主题分类。
在JDReview分类任务中,准确率达到90.318%
商品检索
提升电商平台的商品搜索相关性。
在EcomRetrieval任务中,ndcg@10达到70.991
通用NLP
语义相似度计算
计算两段中文文本的语义相似度。
在STSB任务中,cos_sim_spearman达到81.244
文本聚类
对中文文本进行无监督聚类分析。
在CLSClusteringP2P任务中,v_measure达到60.635