X

Xiaobu Embedding

由 lier007 开发
xiaobu-embedding是一个多任务嵌入模型,支持多种中文自然语言处理任务,包括文本相似度计算、分类、聚类和检索等。
下载量 147
发布时间 : 1/9/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于中文文本的嵌入表示学习,能够生成高质量的文本向量,适用于多种下游任务,如语义相似度计算、文本分类和信息检索等。

模型特点

多任务支持
支持多种自然语言处理任务,包括文本相似度计算、分类、聚类和检索等。
中文优化
专门针对中文文本进行优化,能够更好地捕捉中文语义特征。
高性能
在多个中文基准测试中表现出色,特别是在医疗领域相关任务上表现优异。

模型能力

文本嵌入
语义相似度计算
文本分类
文本聚类
信息检索
重排序

使用案例

医疗领域
医疗问答检索
用于医疗相关问题的检索和回答
在CMedQA检索任务上MAP@10达到37.604
医疗文档重排序
对医疗相关文档进行相关性重排序
在CMedQAv2重排序任务上MAP达到87.57
电子商务
商品评论分类
对商品评论进行情感和主题分类
在京东评论分类任务上准确率达到86.74%
商品检索
电子商务平台中的商品搜索功能
在EcomRetrieval任务上MAP@10达到63.14
通用NLP
文本相似度计算
计算两段文本的语义相似度
在STSB任务上余弦相似度皮尔逊达到79.75
文本分类
对文本进行多类别分类
在IFlyTek分类任务上准确率达到49.74%