S

Stella Large Zh V2

由 infgrad 开发
stella-large-zh-v2 是一个专注于句子相似度计算的中文模型,支持多种语义文本相似度任务和文本分类任务。
下载量 259
发布时间 : 10/13/2023
模型介绍
内容详情
替代品

模型简介

该模型主要用于句子相似度计算、文本分类、文本聚类和重排序等任务,在多个中文评估基准上表现出色。

模型特点

多任务评估基准支持
在多个中文多任务评估基准(如MTEB)上表现优异,涵盖语义文本相似度、文本分类、文本聚类和重排序等任务。
高性能句子相似度计算
在蚂蚁金融问答、ATEC、银行问答等数据集上,句子相似度计算性能突出,支持多种距离度量(余弦相似度、欧氏距离、曼哈顿距离)。
强大的重排序能力
在CMedQAv1和CMedQAv2重排序任务中,平均准确率和平均倒数排名均超过85%,表现优异。

模型能力

句子相似度计算
文本分类
文本聚类
重排序
检索

使用案例

金融领域
金融问答系统
用于金融领域的问答系统,计算用户问题与候选答案的相似度。
在蚂蚁金融问答数据集上,余弦相似度皮尔逊值为47.34,斯皮尔曼值为49.94。
银行客服问答
用于银行客服系统中的问答匹配和相似度计算。
在银行问答数据集上,余弦相似度皮尔逊值为62.83,斯皮尔曼值为65.53。
医疗领域
医疗问答重排序
用于医疗问答系统中的答案重排序,提升答案的相关性。
在CMedQAv1和CMedQAv2重排序任务中,平均准确率分别为85.44和85.82。
新冠信息检索
用于新冠相关信息的检索和排序。
在新冠检索任务中,首位平均准确率为68.86,前十平均准确率为77.10。
通用文本处理
文本分类
用于通用文本分类任务,如亚马逊评论分类。
在亚马逊评论分类(中文)任务中,准确率为40.81,F1分数为39.02。
文本聚类
用于文本聚类任务,如CLS点对点和句对句聚类。
在CLS点对点聚类任务中,V度量为39.95;在句对句聚类任务中,V度量为38.18。