Y
Yinka
由 Classical 开发
该模型在中文文本嵌入基准(MTEB)上进行了多项任务的评估,包括文本相似度、分类、聚类和检索等任务。
下载量 388
发布时间 : 5/30/2024
模型介绍
内容详情
替代品
模型简介
这是一个在中文文本嵌入基准(MTEB)上评估的模型,支持多种自然语言处理任务,如语义相似度计算、文本分类、聚类和信息检索等。
模型特点
多任务评估
在MTEB中文基准的多个任务上进行了全面评估,包括STS、分类、聚类和检索等。
中文优化
专门针对中文文本处理进行了优化,在多个中文数据集上表现良好。
多样化指标
提供多种评估指标,包括皮尔逊相关系数、斯皮尔曼相关系数、准确率、F1分数等。
模型能力
文本相似度计算
文本分类
文本聚类
信息检索
语义匹配
问答重排序
使用案例
电子商务
商品评论分类
对电商平台的商品评论进行情感分类
在JDReview数据集上达到88.48%的准确率
商品检索
电商平台的商品搜索和推荐
在EcomRetrieval数据集上MAP@10达到63.11
医疗健康
医疗问答检索
医疗领域的问题检索和匹配
在CMedQAv1和CMedQAv2数据集上MAP分别达到89.26和90.05
医学文献检索
医学相关文献的检索和排序
在MedicalRetrieval数据集上NDCG@10达到65.20
通用语义理解
语义相似度计算
计算两段文本的语义相似度
在LCQMC数据集上余弦相似度皮尔逊相关系数达到73.68
文本分类
对文本进行多类别分类
在IFlyTek数据集上准确率达到51.77%
标签:
- mteb 模型索引:
- 名称:checkpoint-1431
结果:
- 任务:
类型:STS
数据集:
类型:C-MTEB/AFQMC
名称:MTEB AFQMC
配置:默认
分割:验证集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:56.306314279047875
- 类型:余弦相似度斯皮尔曼 值:61.020227685004016
- 类型:欧氏距离皮尔逊 值:58.61821670933433
- 类型:欧氏距离斯皮尔曼 值:60.131457106640674
- 类型:曼哈顿距离皮尔逊 值:58.6189460369694
- 类型:曼哈顿距离斯皮尔曼 值:60.126350618526224
- 任务:
类型:STS
数据集:
类型:C-MTEB/ATEC
名称:MTEB ATEC
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:55.8612958476143
- 类型:余弦相似度斯皮尔曼 值:59.01977664864512
- 类型:欧氏距离皮尔逊 值:62.028094897243655
- 类型:欧氏距离斯皮尔曼 值:58.6046814257705
- 类型:曼哈顿距离皮尔逊 值:62.02580042431887
- 类型:曼哈顿距离斯皮尔曼 值:58.60626890004892
- 任务:
类型:分类
数据集:
类型:mteb/amazon_reviews_multi
名称:MTEB AmazonReviewsClassification (zh)
配置:zh
分割:测试集
修订版本:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:49.496
- 类型:F1分数 值:46.673963383873065
- 任务:
类型:STS
数据集:
类型:C-MTEB/BQ
名称:MTEB BQ
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:70.73971622592535
- 类型:余弦相似度斯皮尔曼 值:72.76102992060764
- 类型:欧氏距离皮尔逊 值:71.04525865868672
- 类型:欧氏距离斯皮尔曼 值:72.4032852155075
- 类型:曼哈顿距离皮尔逊 值:71.03693009336658
- 类型:曼哈顿距离斯皮尔曼 值:72.39635701224252
- 任务:
类型:聚类
数据集:
类型:C-MTEB/CLSClusteringP2P
名称:MTEB CLSClusteringP2P
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:V度量 值:56.34751074520767
- 任务:
类型:聚类
数据集:
类型:C-MTEB/CLSClusteringS2S
名称:MTEB CLSClusteringS2S
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:V度量 值:48.4856662121073
- 任务:
类型:重排序
数据集:
类型:C-MTEB/CMedQAv1-reranking
名称:MTEB CMedQAv1
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:平均精度(MAP) 值:89.26384109024997
- 类型:平均倒数排名(MRR) 值:91.27261904761905
- 任务:
类型:重排序
数据集:
类型:C-MTEB/CMedQAv2-reranking
名称:MTEB CMedQAv2
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:平均精度(MAP) 值:90.0464058154547
- 类型:平均倒数排名(MRR) 值:92.06480158730159
- 任务:
类型:检索
数据集:
类型:C-MTEB/CmedqaRetrieval
名称:MTEB CmedqaRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:27.236
- 类型:排名10的平均精度(MAP@10) 值:40.778
- 类型:排名100的平均精度(MAP@100) 值:42.692
- 类型:排名1000的平均精度(MAP@1000) 值:42.787
- 类型:排名3的平均精度(MAP@3) 值:36.362
- 类型:排名5的平均精度(MAP@5) 值:38.839
- 类型:排名1的平均倒数排名(MRR@1) 值:41.335
- 类型:排名10的平均倒数排名(MRR@10) 值:49.867
- 类型:排名100的平均倒数排名(MRR@100) 值:50.812999999999995
- 类型:排名1000的平均倒数排名(MRR@1000) 值:50.848000000000006
- 类型:排名3的平均倒数排名(MRR@3) 值:47.354
- 类型:排名5的平均倒数排名(MRR@5) 值:48.718
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:41.335
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:47.642
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:54.855
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:56.449000000000005
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:42.203
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:44.416
- 类型:排名1的精确率(P@1) 值:41.335
- 类型:排名10的精确率(P@10) 值:10.568
- 类型:排名100的精确率(P@100) 值:1.6400000000000001
- 类型:排名1000的精确率(P@1000) 值:0.184
- 类型:排名3的精确率(P@3) 值:23.998
- 类型:排名5的精确率(P@5) 值:17.389
- 类型:排名1的召回率(R@1) 值:27.236
- 类型:排名10的召回率(R@10) 值:58.80800000000001
- 类型:排名100的召回率(R@100) 值:88.411
- 类型:排名1000的召回率(R@1000) 值:99.032
- 类型:排名3的召回率(R@3) 值:42.253
- 类型:排名5的召回率(R@5) 值:49.118
- 任务:
类型:对分类
数据集:
类型:C-MTEB/CMNLI
名称:MTEB Cmnli
配置:默认
分割:验证集
修订版本:无
指标:
- 类型:余弦相似度准确率 值:86.03728202044498
- 类型:余弦相似度平均精度(AP) 值:92.49469583272597
- 类型:余弦相似度F1分数 值:86.74095974528088
- 类型:余弦相似度精确率 值:84.43657294664601
- 类型:余弦相似度召回率 值:89.17465513210195
- 类型:点积准确率 值:72.21888153938664
- 类型:点积平均精度(AP) 值:80.59377163340332
- 类型:点积F1分数 值:74.96686040583258
- 类型:点积精确率 值:66.4737793851718
- 类型:点积召回率 值:85.94809445873275
- 类型:欧氏距离准确率 值:85.47203848466627
- 类型:欧氏距离平均精度(AP) 值:91.89152584749868
- 类型:欧氏距离F1分数 值:86.38105975197294
- 类型:欧氏距离精确率 值:83.40953625081646
- 类型:欧氏距离召回率 值:89.5721299976619
- 类型:曼哈顿距离准确率 值:85.3758268190018
- 类型:曼哈顿距离平均精度(AP) 值:91.88989707722311
- 类型:曼哈顿距离F1分数 值:86.39767519839052
- 类型:曼哈顿距离精确率 值:82.76231263383298
- 类型:曼哈顿距离召回率 值:90.36707972878185
- 类型:最大准确率 值:86.03728202044498
- 类型:最大平均精度(AP) 值:92.49469583272597
- 类型:最大F1分数 值:86.74095974528088
- 任务:
类型:检索
数据集:
类型:C-MTEB/CovidRetrieval
名称:MTEB CovidRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:74.34100000000001
- 类型:排名10的平均精度(MAP@10) 值:82.49499999999999
- 类型:排名100的平均精度(MAP@100) 值:82.64200000000001
- 类型:排名1000的平均精度(MAP@1000) 值:82.643
- 类型:排名3的平均精度(MAP@3) 值:81.142
- 类型:排名5的平均精度(MAP@5) 值:81.95400000000001
- 类型:排名1的平均倒数排名(MRR@1) 值:74.71
- 类型:排名10的平均倒数排名(MRR@10) 值:82.553
- 类型:排名100的平均倒数排名(MRR@100) 值:82.699
- 类型:排名1000的平均倒数排名(MRR@1000) 值:82.70100000000001
- 类型:排名3的平均倒数排名(MRR@3) 值:81.279
- 类型:排名5的平均倒数排名(MRR@5) 值:82.069
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:74.605
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:85.946
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:86.607
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:86.669
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:83.263
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:84.71600000000001
- 类型:排名1的精确率(P@1) 值:74.605
- 类型:排名10的精确率(P@10) 值:9.758
- 类型:排名100的精确率(P@100) 值:1.005
- 类型:排名1000的精确率(P@1000) 值:0.101
- 类型:排名3的精确率(P@3) 值:29.996000000000002
- 类型:排名5的精确率(P@5) 值:18.736
- 类型:排名1的召回率(R@1) 值:74.34100000000001
- 类型:排名10的召回率(R@10) 值:96.523
- 类型:排名100的召回率(R@100) 值:99.473
- 类型:排名1000的召回率(R@1000) 值:100.0
- 类型:排名3的召回率(R@3) 值:89.278
- 类型:排名5的召回率(R@5) 值:92.83500000000001
- 任务:
类型:检索
数据集:
类型:C-MTEB/DuRetrieval
名称:MTEB DuRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:26.950000000000003
- 类型:排名10的平均精度(MAP@10) 值:82.408
- 类型:排名100的平均精度(MAP@100) 值:85.057
- 类型:排名1000的平均精度(MAP@1000) 值:85.09100000000001
- 类型:排名3的平均精度(MAP@3) 值:57.635999999999996
- 类型:排名5的平均精度(MAP@5) 值:72.48
- 类型:排名1的平均倒数排名(MRR@1) 值:92.15
- 类型:排名10的平均倒数排名(MRR@10) 值:94.554
- 类型:排名100的平均倒数排名(MRR@100) 值:94.608
- 类型:排名1000的平均倒数排名(MRR@1000) 值:94.61
- 类型:排名3的平均倒数排名(MRR@3) 值:94.292
- 类型:排名5的平均倒数排名(MRR@5) 值:94.459
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:92.15
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:89.108
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:91.525
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:91.82900000000001
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:88.44
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:87.271
- 类型:排名1的精确率(P@1) 值:92.15
- 类型:排名10的精确率(P@10) 值:42.29
- 类型:排名100的精确率(P@100) 值:4.812
- 类型:排名1000的精确率(P@1000) 值:0.48900000000000005
- 类型:排名3的精确率(P@3) 值:79.14999999999999
- 类型:排名5的精确率(P@5) 值:66.64
- 类型:排名1的召回率(R@1) 值:26.950000000000003
- 类型:排名10的召回率(R@10) 值:89.832
- 类型:排名100的召回率(R@100) 值:97.921
- 类型:排名1000的召回率(R@1000) 值:99.471
- 类型:排名3的召回率(R@3) 值:59.562000000000005
- 类型:排名5的召回率(R@5) 值:76.533
- 任务:
类型:检索
数据集:
类型:C-MTEB/EcomRetrieval
名称:MTEB EcomRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:53.5
- 类型:排名10的平均精度(MAP@10) 值:63.105999999999995
- 类型:排名100的平均精度(MAP@100) 值:63.63100000000001
- 类型:排名1000的平均精度(MAP@1000) 值:63.641999999999996
- 类型:排名3的平均精度(MAP@3) 值:60.617
- 类型:排名5的平均精度(MAP@5) 值:62.132
- 类型:排名1的平均倒数排名(MRR@1) 值:53.5
- 类型:排名10的平均倒数排名(MRR@10) 值:63.105999999999995
- 类型:排名100的平均倒数排名(MRR@100) 值:63.63100000000001
- 类型:排名1000的平均倒数排名(MRR@1000) 值:63.641999999999996
- 类型:排名3的平均倒数排名(MRR@3) 值:60.617
- 类型:排名5的平均倒数排名(MRR@5) 值:62.132
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:53.5
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:67.92200000000001
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:70.486
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:70.777
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:62.853
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:65.59899999999999
- 类型:排名1的精确率(P@1) 值:53.5
- 类型:排名10的精确率(P@10) 值:8.309999999999999
- 类型:排名100的精确率(P@100) 值:0.951
- 类型:排名1000的精确率(P@1000) 值:0.097
- 类型:排名3的精确率(P@3) 值:23.1
- 类型:排名5的精确率(P@5) 值:15.2
- 类型:排名1的召回率(R@1) 值:53.5
- 类型:排名10的召回率(R@10) 值:83.1
- 类型:排名100的召回率(R@100) 值:95.1
- 类型:排名1000的召回率(R@1000) 值:97.39999999999999
- 类型:排名3的召回率(R@3) 值:69.3
- 类型:排名5的召回率(R@5) 值:76.0
- 任务:
类型:分类
数据集:
类型:C-MTEB/IFlyTek-classification
名称:MTEB IFlyTek
配置:默认
分割:验证集
修订版本:无
指标:
- 类型:准确率 值:51.773759138130046
- 类型:F1分数 值:40.38600802756481
- 任务:
类型:分类
数据集:
类型:C-MTEB/JDReview-classification
名称:MTEB JDReview
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:准确率 值:88.48030018761726
- 类型:平均精度(AP) 值:59.2732541555627
- 类型:F1分数 值:83.58836007358619
- 任务:
类型:STS
数据集:
类型:C-MTEB/LCQMC
名称:MTEB LCQMC
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:73.67511194245922
- 类型:余弦相似度斯皮尔曼 值:79.43347759067298
- 类型:欧氏距离皮尔逊 值:79.04491504318766
- 类型:欧氏距离斯皮尔曼 值:79.14478545356785
- 类型:曼哈顿距离皮尔逊 值:79.03365022867428
- 类型:曼哈顿距离斯皮尔曼 值:79.13172717619908
- 任务:
类型:检索
数据集:
类型:C-MTEB/MMarcoRetrieval
名称:MTEB MMarcoRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:67.184
- 类型:排名10的平均精度(MAP@10) 值:76.24600000000001
- 类型:排名100的平均精度(MAP@100) 值:76.563
- 类型:排名1000的平均精度(MAP@1000) 值:76.575
- 类型:排名3的平均精度(MAP@3) 值:74.522
- 类型:排名5的平均精度(MAP@5) 值:75.598
- 类型:排名1的平均倒数排名(MRR@1) 值:69.47
- 类型:排名10的平均倒数排名(MRR@10) 值:76.8
- 类型:排名100的平均倒数排名(MRR@100) 值:77.082
- 类型:排名1000的平均倒数排名(MRR@1000) 值:77.093
- 类型:排名3的平均倒数排名(MRR@3) 值:75.29400000000001
- 类型:排名5的平均倒数排名(MRR@5) 值:76.24
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:69.47
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:79.81099999999999
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:81.187
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:81.492
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:76.536
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:78.367
- 类型:排名1的精确率(P@1) 值:69.47
- 类型:排名10的精确率(P@10) 值:9.599
- 类型:排名100的精确率(P@100) 值:1.026
- 类型:排名1000的精确率(P@1000) 值:0.105
- 类型:排名3的精确率(P@3) 值:28.777
- 类型:排名5的精确率(P@5) 值:18.232
- 类型:排名1的召回率(R@1) 值:67.184
- 类型:排名10的召回率(R@10) 值:90.211
- 类型:排名100的召回率(R@100) 值:96.322
- 类型:排名1000的召回率(R@1000) 值:98.699
- 类型:排名3的召回率(R@3) 值:81.556
- 类型:排名5的召回率(R@5) 值:85.931
- 任务:
类型:分类
数据集:
类型:mteb/amazon_massive_intent
名称:MTEB MassiveIntentClassification (zh-CN)
配置:zh-CN
分割:测试集
修订版本:31efe3c427b0bae9c22cbb560b8f15491cc6bed7
指标:
- 类型:准确率 值:76.96032279757901
- 类型:F1分数 值:73.48052314033545
- 任务:
类型:分类
数据集:
类型:mteb/amazon_massive_scenario
名称:MTEB MassiveScenarioClassification (zh-CN)
配置:zh-CN
分割:测试集
修订版本:7d571f92784cd94a019292a1f45445077d0ef634
指标:
- 类型:准确率 值:84.64357767316744
- 类型:F1分数 值:83.58250539497922
- 任务:
类型:检索
数据集:
类型:C-MTEB/MedicalRetrieval
名称:MTEB MedicalRetrieval
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:排名1的平均精度(MAP@1) 值:56.00000000000001
- 类型:排名10的平均精度(MAP@10) 值:62.066
- 类型:排名100的平均精度(MAP@100) 值:62.553000000000004
- 类型:排名1000的平均精度(MAP@1000) 值:62.598
- 类型:排名3的平均精度(MAP@3) 值:60.4
- 类型:排名5的平均精度(MAP@5) 值:61.370000000000005
- 类型:排名1的平均倒数排名(MRR@1) 值:56.2
- 类型:排名10的平均倒数排名(MRR@10) 值:62.166
- 类型:排名100的平均倒数排名(MRR@100) 值:62.653000000000006
- 类型:排名1000的平均倒数排名(MRR@1000) 值:62.699000000000005
- 类型:排名3的平均倒数排名(MRR@3) 值:60.5
- 类型:排名5的平均倒数排名(MRR@5) 值:61.47
- 类型:排名1的标准化折损累积增益(NDCG@1) 值:56.00000000000001
- 类型:排名10的标准化折损累积增益(NDCG@10) 值:65.199
- 类型:排名100的标准化折损累积增益(NDCG@100) 值:67.79899999999999
- 类型:排名1000的标准化折损累积增益(NDCG@1000) 值:69.056
- 类型:排名3的标准化折损累积增益(NDCG@3) 值:61.814
- 类型:排名5的标准化折损累积增益(NDCG@5) 值:63.553000000000004
- 类型:排名1的精确率(P@1) 值:56.00000000000001
- 类型:排名10的精确率(P@10) 值:7.51
- 类型:排名100的精确率(P@100) 值:0.878
- 类型:排名1000的精确率(P@1000) 值:0.098
- 类型:排名3的精确率(P@3) 值:21.967
- 类型:排名5的精确率(P@5) 值:14.02
- 类型:排名1的召回率(R@1) 值:56.00000000000001
- 类型:排名10的召回率(R@10) 值:75.1
- 类型:排名100的召回率(R@100) 值:87.8
- 类型:排名1000的召回率(R@1000) 值:97.7
- 类型:排名3的召回率(R@3) 值:65.9
- 类型:排名5的召回率(R@5) 值:70.1
- 任务:
类型:重排序
数据集:
类型:C-MTEB/Mmarco-reranking
名称:MTEB MMarcoReranking
配置:默认
分割:开发集
修订版本:无
指标:
- 类型:平均精度(MAP) 值:32.74158258279793
- 类型:平均倒数排名(MRR) 值:31.56071428571428
- 任务:
类型:分类
数据集:
类型:C-MTEB/MultilingualSentiment-classification
名称:MTEB MultilingualSentiment
配置:默认
分割:验证集
修订版本:无
指标:
- 类型:准确率 值:78.96666666666667
- 类型:F1分数 值:78.82528563818045
- 任务:
类型:对分类
数据集:
类型:C-MTEB/OCNLI
名称:MTEB Ocnli
配置:默认
分割:验证集
修订版本:无
指标:
- 类型:余弦相似度准确率 值:83.54087709799674
- 类型:余弦相似度平均精度(AP) 值:87.26170197077586
- 类型:余弦相似度F1分数 值:84.7609561752988
- 类型:余弦相似度精确率 值:80.20735155513667
- 类型:余弦相似度召回率 值:89.86272439281943
- 类型:点积准确率 值:72.22523010286952
- 类型:点积平均精度(AP) 值:79.51975358187732
- 类型:点积F1分数 值:76.32183908045977
- 类型:点积精确率 值:67.58957654723126
- 类型:点积召回率 值:87.64519535374869
- 类型:欧氏距离准确率 值:82.0249052517596
- 类型:欧氏距离平均精度(AP) 值:85.32829948726406
- 类型:欧氏距离F1分数 值:83.24924318869829
- 类型:欧氏距离精确率 值:79.71014492753623
- 类型:欧氏距离召回率 值:87.11721224920802
- 类型:曼哈顿距离准确率 值:82.13318895506227
- 类型:曼哈顿距离平均精度(AP) 值:85.28856869288006
- 类型:曼哈顿距离F1分数 值:83.34946757018393
- 类型:曼哈顿距离精确率 值:76.94369973190348
- 类型:曼哈顿距离召回率 值:90.91869060190075
- 类型:最大准确率 值:83.54087709799674
- 类型:最大平均精度(AP) 值:87.26170197077586
- 类型:最大F1分数 值:84.7609561752988
- 任务:
类型:分类
数据集:
类型:C-MTEB/OnlineShopping-classification
名称:MTEB OnlineShopping
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:准确率 值:94.56
- 类型:平均精度(AP) 值:92.80848436710805
- 类型:F1分数 值:94.54951966576111
- 任务:
类型:STS
数据集:
类型:C-MTEB/PAWSX
名称:MTEB PAWSX
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:39.0866558287863
- 类型:余弦相似度斯皮尔曼 值:45.9211126233312
- 类型:欧氏距离皮尔逊 值:44.86568743222145
- 类型:欧氏距离斯皮尔曼 值:45.63882757207507
- 类型:曼哈顿距离皮尔逊 值:44.89480036909126
- 类型:曼哈顿距离斯皮尔曼 值:45.65929449046206
- 任务:
类型:STS
数据集:
类型:C-MTEB/QBQTC
名称:MTEB QBQTC
配置:默认
分割:测试集
修订版本:无
指标:
- 类型:余弦相似度皮尔逊 值:43.04701793979569
- 类型:余弦相似度斯皮尔曼 值:44.87491033760315
- 类型
- 任务:
类型:STS
数据集:
类型:C-MTEB/AFQMC
名称:MTEB AFQMC
配置:默认
分割:验证集
修订版本:无
指标:
Phi 2 GGUF
其他
Phi-2是微软开发的一个小型但强大的语言模型,具有27亿参数,专注于高效推理和高质量文本生成。
大型语言模型
支持多种语言
P
TheBloke
41.5M
205
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型
英语
R
FacebookAI
19.4M
212
Distilbert Base Uncased
Apache-2.0
DistilBERT是BERT基础模型的蒸馏版本,在保持相近性能的同时更轻量高效,适用于序列分类、标记分类等自然语言处理任务。
大型语言模型
英语
D
distilbert
11.1M
669
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型
英语
L
modularai
9.7M
4
Xlm Roberta Base
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型
支持多种语言
X
FacebookAI
9.6M
664
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型
英语
R
FacebookAI
9.3M
488
Opt 125m
其他
OPT是由Meta AI发布的开放预训练Transformer语言模型套件,参数量从1.25亿到1750亿,旨在对标GPT-3系列性能,同时促进大规模语言模型的开放研究。
大型语言模型
英语
O
facebook
6.3M
198
Llama 3.1 8B Instruct
Llama 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B参数规模,支持8种语言和代码生成,优化了多语言对话场景。
大型语言模型
Transformers

支持多种语言
L
meta-llama
5.7M
3,898
T5 Base
Apache-2.0
T5基础版是由Google开发的文本到文本转换Transformer模型,参数规模2.2亿,支持多语言NLP任务。
大型语言模型
支持多种语言
T
google-t5
5.4M
702
Xlm Roberta Large
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型
支持多种语言
X
FacebookAI
5.3M
431
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文