S

Stella Large Zh V3 1792d

由 dunzhang 开发
stella-large-zh-v3-1792d 是一个中文句子相似度计算模型,基于句子转换器架构,专门用于处理中文文本的语义相似度任务。
下载量 862
发布时间 : 2/17/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于计算中文句子的语义相似度,支持多种相似度计算方式,包括余弦相似度、欧几里得距离和曼哈顿距离等。适用于文本匹配、信息检索和自然语言理解任务。

模型特点

多维度相似度计算
支持余弦相似度、欧几里得距离和曼哈顿距离等多种相似度计算方式。
高性能
在多个中文数据集上表现优异,特别是在C-MTEB/CMedQAv1和C-MTEB/CMedQAv2重排序任务中MAP值接近90。
广泛的任务支持
不仅支持句子相似度计算,还能应用于分类、聚类和检索等多种自然语言处理任务。

模型能力

句子相似度计算
文本分类
文本聚类
信息检索
重排序

使用案例

信息检索
医疗问答检索
在CMedQA数据集上用于检索相关医疗问答
MAP@10达到40.14,MRR@10达到48.93
文本匹配
金融问题匹配
在BQ数据集上用于金融问题的语义匹配
余弦相似度皮尔逊值达到69.12
文本分类
商品评论分类
在AmazonReviews中文数据集上进行评论分类
准确率达到46.32