模型简介
该模型主要用于句子相似度计算、文本分类、文本聚类和重排序等任务,在多个中文评估基准上表现出色。
模型特点
多任务评估基准支持
在多个中文多任务评估基准(如MTEB)上表现优异,涵盖语义文本相似度、文本分类、文本聚类和重排序等任务。
高性能句子相似度计算
在蚂蚁金融问答、ATEC、银行问答等数据集上,句子相似度计算性能突出,支持多种距离度量(余弦相似度、欧氏距离、曼哈顿距离)。
强大的重排序能力
在CMedQAv1和CMedQAv2重排序任务中,平均准确率和平均倒数排名均超过85%,表现优异。
模型能力
句子相似度计算
文本分类
文本聚类
重排序
检索
使用案例
金融领域
金融问答系统
用于金融领域的问答系统,计算用户问题与候选答案的相似度。
在蚂蚁金融问答数据集上,余弦相似度皮尔逊值为47.34,斯皮尔曼值为49.94。
银行客服问答
用于银行客服系统中的问答匹配和相似度计算。
在银行问答数据集上,余弦相似度皮尔逊值为62.83,斯皮尔曼值为65.53。
医疗领域
医疗问答重排序
用于医疗问答系统中的答案重排序,提升答案的相关性。
在CMedQAv1和CMedQAv2重排序任务中,平均准确率分别为85.44和85.82。
新冠信息检索
用于新冠相关信息的检索和排序。
在新冠检索任务中,首位平均准确率为68.86,前十平均准确率为77.10。
通用文本处理
文本分类
用于通用文本分类任务,如亚马逊评论分类。
在亚马逊评论分类(中文)任务中,准确率为40.81,F1分数为39.02。
文本聚类
用于文本聚类任务,如CLS点对点和句对句聚类。
在CLS点对点聚类任务中,V度量为39.95;在句对句聚类任务中,V度量为38.18。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文