X
Xiaobu Embedding
由 lier007 开发
xiaobu-embedding是一个多任务嵌入模型,支持多种中文自然语言处理任务,包括文本相似度计算、分类、聚类和检索等。
下载量 147
发布时间 : 1/9/2024
模型介绍
内容详情
替代品
模型简介
该模型专注于中文文本的嵌入表示学习,能够生成高质量的文本向量,适用于多种下游任务,如语义相似度计算、文本分类和信息检索等。
模型特点
多任务支持
支持多种自然语言处理任务,包括文本相似度计算、分类、聚类和检索等。
中文优化
专门针对中文文本进行优化,能够更好地捕捉中文语义特征。
高性能
在多个中文基准测试中表现出色,特别是在医疗领域相关任务上表现优异。
模型能力
文本嵌入
语义相似度计算
文本分类
文本聚类
信息检索
重排序
使用案例
医疗领域
医疗问答检索
用于医疗相关问题的检索和回答
在CMedQA检索任务上MAP@10达到37.604
医疗文档重排序
对医疗相关文档进行相关性重排序
在CMedQAv2重排序任务上MAP达到87.57
电子商务
商品评论分类
对商品评论进行情感和主题分类
在京东评论分类任务上准确率达到86.74%
商品检索
电子商务平台中的商品搜索功能
在EcomRetrieval任务上MAP@10达到63.14
通用NLP
文本相似度计算
计算两段文本的语义相似度
在STSB任务上余弦相似度皮尔逊达到79.75
文本分类
对文本进行多类别分类
在IFlyTek分类任务上准确率达到49.74%
标签:
- mteb 模型索引:
- 名称: xiaobu-embedding
结果:
- 任务:
类型: STS
数据集:
类型: C-MTEB/AFQMC
名称: MTEB AFQMC
配置: 默认
拆分: 验证
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 49.37874132528482
- 类型: 余弦相似度斯皮尔曼 值: 54.84722470052176
- 类型: 欧几里得皮尔逊 值: 53.0495882931575
- 类型: 欧几里得斯皮尔曼 值: 54.847727301700665
- 类型: 曼哈顿皮尔逊 值: 53.0632140838278
- 类型: 曼哈顿斯皮尔曼 值: 54.8744258024692
- 任务:
类型: STS
数据集:
类型: C-MTEB/ATEC
名称: MTEB ATEC
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 48.15992903013723
- 类型: 余弦相似度斯皮尔曼 值: 55.13198035464577
- 类型: 欧几里得皮尔逊 值: 55.435876753245715
- 类型: 欧几里得斯皮尔曼 值: 55.13215936702871
- 类型: 曼哈顿皮尔逊 值: 55.41429518223402
- 类型: 曼哈顿斯皮尔曼 值: 55.13363087679285
- 任务:
类型: 分类
数据集:
类型: mteb/amazon_reviews_multi
名称: MTEB 亚马逊评论分类 (中文)
配置: zh
拆分: 测试
修订: 1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型: 准确率 值: 46.722
- 类型: F1分数 值: 45.039340641893205
- 任务:
类型: STS
数据集:
类型: C-MTEB/BQ
名称: MTEB BQ
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 63.517830355554224
- 类型: 余弦相似度斯皮尔曼 值: 65.57007801018649
- 类型: 欧几里得皮尔逊 值: 64.05153340906585
- 类型: 欧几里得斯皮尔曼 值: 65.5696865661119
- 类型: 曼哈顿皮尔逊 值: 63.95710619755406
- 类型: 曼哈顿斯皮尔曼 值: 65.48565785379489
- 任务:
类型: 聚类
数据集:
类型: C-MTEB/CLSClusteringP2P
名称: MTEB CLSClusteringP2P
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: V度量 值: 43.24046498507819
- 任务:
类型: 聚类
数据集:
类型: C-MTEB/CLSClusteringS2S
名称: MTEB CLSClusteringS2S
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: V度量 值: 41.22618199372116
- 任务:
类型: 重排序
数据集:
类型: C-MTEB/CMedQAv1-reranking
名称: MTEB CMedQAv1
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: MAP 值: 87.12213224673621
- 类型: MRR 值: 89.57150793650794
- 任务:
类型: 重排序
数据集:
类型: C-MTEB/CMedQAv2-reranking
名称: MTEB CMedQAv2
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: MAP 值: 87.57290061886421
- 类型: MRR 值: 90.19202380952382
- 任务:
类型: 检索
数据集:
类型: C-MTEB/CmedqaRetrieval
名称: MTEB CmedqaRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 25.22
- 类型: MAP@10 值: 37.604
- 类型: MAP@100 值: 39.501
- 类型: MAP@1000 值: 39.614
- 类型: MAP@3 值: 33.378
- 类型: MAP@5 值: 35.774
- 类型: MRR@1 值: 38.385000000000005
- 类型: MRR@10 值: 46.487
- 类型: MRR@100 值: 47.504999999999995
- 类型: MRR@1000 值: 47.548
- 类型: MRR@3 值: 43.885999999999996
- 类型: MRR@5 值: 45.373000000000005
- 类型: NDCG@1 值: 38.385000000000005
- 类型: NDCG@10 值: 44.224999999999994
- 类型: NDCG@100 值: 51.637
- 类型: NDCG@1000 值: 53.55799999999999
- 类型: NDCG@3 值: 38.845
- 类型: NDCG@5 值: 41.163
- 类型: 精确率@1 值: 38.385000000000005
- 类型: 精确率@10 值: 9.812
- 类型: 精确率@100 值: 1.58
- 类型: 精确率@1000 值: 0.183
- 类型: 精确率@3 值: 21.88
- 类型: 精确率@5 值: 15.974
- 类型: 召回率@1 值: 25.22
- 类型: 召回率@10 值: 54.897
- 类型: 召回率@100 值: 85.469
- 类型: 召回率@1000 值: 98.18599999999999
- 类型: 召回率@3 值: 38.815
- 类型: 召回率@5 值: 45.885
- 任务:
类型: 对分类
数据集:
类型: C-MTEB/CMNLI
名称: MTEB Cmnli
配置: 默认
拆分: 验证
修订: 无
指标:
- 类型: 余弦相似度准确率 值: 83.22309079975948
- 类型: 余弦相似度AP 值: 89.94833400328307
- 类型: 余弦相似度F1 值: 84.39319055464031
- 类型: 余弦相似度精确率 值: 79.5774647887324
- 类型: 余弦相似度召回率 值: 89.82931961655366
- 类型: 点积准确率 值: 83.22309079975948
- 类型: 点积AP 值: 89.95618559578415
- 类型: 点积F1 值: 84.41173239591345
- 类型: 点积精确率 值: 79.61044343141317
- 类型: 点积召回率 值: 89.82931961655366
- 类型: 欧几里得准确率 值: 83.23511725796753
- 类型: 欧几里得AP 值: 89.94836342787318
- 类型: 欧几里得F1 值: 84.40550133096718
- 类型: 欧几里得精确率 值: 80.29120067524794
- 类型: 欧几里得召回率 值: 88.9642272620996
- 类型: 曼哈顿准确率 值: 83.23511725796753
- 类型: 曼哈顿AP 值: 89.9450103956978
- 类型: 曼哈顿F1 值: 84.44444444444444
- 类型: 曼哈顿精确率 值: 80.09647651006712
- 类型: 曼哈顿召回率 值: 89.29155950432546
- 类型: 最大准确率 值: 83.23511725796753
- 类型: 最大AP 值: 89.95618559578415
- 类型: 最大F1 值: 84.44444444444444
- 任务:
类型: 检索
数据集:
类型: C-MTEB/CovidRetrieval
名称: MTEB CovidRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 76.87
- 类型: MAP@10 值: 84.502
- 类型: MAP@100 值: 84.615
- 类型: MAP@1000 值: 84.617
- 类型: MAP@3 值: 83.127
- 类型: MAP@5 值: 83.99600000000001
- 类型: MRR@1 值: 77.02799999999999
- 类型: MRR@10 值: 84.487
- 类型: MRR@100 值: 84.59299999999999
- 类型: MRR@1000 值: 84.59400000000001
- 类型: MRR@3 值: 83.193
- 类型: MRR@5 值: 83.994
- 类型: NDCG@1 值: 77.134
- 类型: NDCG@10 值: 87.68599999999999
- 类型: NDCG@100 值: 88.17099999999999
- 类型: NDCG@1000 值: 88.21
- 类型: NDCG@3 值: 84.993
- 类型: NDCG@5 值: 86.519
- 类型: 精确率@1 值: 77.134
- 类型: 精确率@10 值: 9.841999999999999
- 类型: 精确率@100 值: 1.006
- 类型: 精确率@1000 值: 0.101
- 类型: 精确率@3 值: 30.313000000000002
- 类型: 精确率@5 值: 18.945999999999998
- 类型: 召回率@1 值: 76.87
- 类型: 召回率@10 值: 97.418
- 类型: 召回率@100 值: 99.579
- 类型: 召回率@1000 值: 99.895
- 类型: 召回率@3 值: 90.227
- 类型: 召回率@5 值: 93.888
- 任务:
类型: 检索
数据集:
类型: C-MTEB/DuRetrieval
名称: MTEB DuRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 25.941
- 类型: MAP@10 值: 78.793
- 类型: MAP@100 值: 81.57799999999999
- 类型: MAP@1000 值: 81.626
- 类型: MAP@3 值: 54.749
- 类型: MAP@5 值: 69.16
- 类型: MRR@1 值: 90.45
- 类型: MRR@10 值: 93.406
- 类型: MRR@100 值: 93.453
- 类型: MRR@1000 值: 93.45700000000001
- 类型: MRR@3 值: 93.10000000000001
- 类型: MRR@5 值: 93.27499999999999
- 类型: NDCG@1 值: 90.45
- 类型: NDCG@10 值: 86.44500000000001
- 类型: NDCG@100 值: 89.28399999999999
- 类型: NDCG@1000 值: 89.739
- 类型: NDCG@3 值: 85.62100000000001
- 类型: NDCG@5 值: 84.441
- 类型: 精确率@1 值: 90.45
- 类型: 精确率@10 值: 41.19
- 类型: 精确率@100 值: 4.761
- 类型: 精确率@1000 值: 0.48700000000000004
- 类型: 精确率@3 值: 76.583
- 类型: 精确率@5 值: 64.68
- 类型: 召回率@1 值: 25.941
- 类型: 召回率@10 值: 87.443
- 类型: 召回率@100 值: 96.54
- 类型: 召回率@1000 值: 98.906
- 类型: 召回率@3 值: 56.947
- 类型: 召回率@5 值: 73.714
- 任务:
类型: 检索
数据集:
类型: C-MTEB/EcomRetrieval
名称: MTEB EcomRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 52.900000000000006
- 类型: MAP@10 值: 63.144
- 类型: MAP@100 值: 63.634
- 类型: MAP@1000 值: 63.644999999999996
- 类型: MAP@3 值: 60.817
- 类型: MAP@5 值: 62.202
- 类型: MRR@1 值: 52.900000000000006
- 类型: MRR@10 值: 63.144
- 类型: MRR@100 值: 63.634
- 类型: MRR@1000 值: 63.644999999999996
- 类型: MRR@3 值: 60.817
- 类型: MRR@5 值: 62.202
- 类型: NDCG@1 值: 52.900000000000006
- 类型: NDCG@10 值: 68.042
- 类型: NDCG@100 值: 70.417
- 类型: NDCG@1000 值: 70.722
- 类型: NDCG@3 值: 63.287000000000006
- 类型: NDCG@5 值: 65.77
- 类型: 精确率@1 值: 52.900000000000006
- 类型: 精确率@10 值: 8.34
- 类型: 精确率@100 值: 0.9450000000000001
- 类型: 精确率@1000 值: 0.097
- 类型: 精确率@3 值: 23.467
- 类型: 精确率@5 值: 15.28
- 类型: 召回率@1 值: 52.900000000000006
- 类型: 召回率@10 值: 83.39999999999999
- 类型: 召回率@100 值: 94.5
- 类型: 召回率@1000 值: 96.89999999999999
- 类型: 召回率@3 值: 70.39999999999999
- 类型: 召回率@5 值: 76.4
- 任务:
类型: 分类
数据集:
类型: C-MTEB/IFlyTek-classification
名称: MTEB IFlyTek
配置: 默认
拆分: 验证
修订: 无
指标:
- 类型: 准确率 值: 49.74220854174683
- 类型: F1分数 值: 38.01399980618159
- 任务:
类型: 分类
数据集:
类型: C-MTEB/JDReview-classification
名称: MTEB JDReview
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 准确率 值: 86.73545966228893
- 类型: AP 值: 55.72394235169542
- 类型: F1分数 值: 81.58550390953492
- 任务:
类型: STS
数据集:
类型: C-MTEB/LCQMC
名称: MTEB LCQMC
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 69.96711977441642
- 类型: 余弦相似度斯皮尔曼 值: 75.54747609685569
- 类型: 欧几里得皮尔逊 值: 74.62663478056035
- 类型: 欧几里得斯皮尔曼 值: 75.54761576699639
- 类型: 曼哈顿皮尔逊 值: 74.60983904582241
- 类型: 曼哈顿斯皮尔曼 值: 75.52758938061503
- 任务:
类型: 重排序
数据集:
类型: C-MTEB/Mmarco-reranking
名称: MTEB MMarcoReranking
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP 值: 28.076927649720986
- 类型: MRR 值: 26.98015873015873
- 任务:
类型: 检索
数据集:
类型: C-MTEB/MMarcoRetrieval
名称: MTEB MMarcoRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 65.58
- 类型: MAP@10 值: 74.763
- 类型: MAP@100 值: 75.077
- 类型: MAP@1000 值: 75.091
- 类型: MAP@3 值: 72.982
- 类型: MAP@5 值: 74.155
- 类型: MRR@1 值: 67.822
- 类型: MRR@10 值: 75.437
- 类型: MRR@100 值: 75.702
- 类型: MRR@1000 值: 75.715
- 类型: MRR@3 值: 73.91799999999999
- 类型: MRR@5 值: 74.909
- 类型: NDCG@1 值: 67.822
- 类型: NDCG@10 值: 78.472
- 类型: NDCG@100 值: 79.891
- 类型: NDCG@1000 值: 80.262
- 类型: NDCG@3 值: 75.138
- 类型: NDCG@5 值: 77.094
- 类型: 精确率@1 值: 67.822
- 类型: 精确率@10 值: 9.474
- 类型: 精确率@100 值: 1.019
- 类型: 精确率@1000 值: 0.105
- 类型: 精确率@3 值: 28.281
- 类型: 精确率@5 值: 18.017
- 类型: 召回率@1 值: 65.58
- 类型: 召回率@10 值: 89.18599999999999
- 类型: 召回率@100 值: 95.64399999999999
- 类型: 召回率@1000 值: 98.541
- 类型: 召回率@3 值: 80.455
- 类型: 召回率@5 值: 85.063
- 任务:
类型: 分类
数据集:
类型: mteb/amazon_massive_intent
名称: MTEB MassiveIntent分类 (zh-CN)
配置: zh-CN
拆分: 测试
修订: 31efe3c427b0bae9c22cbb560b8f15491cc6bed7
指标:
- 类型: 准确率 值: 72.86819098856758
- 类型: F1分数 值: 70.25369778283451
- 任务:
类型: 分类
数据集:
类型: mteb/amazon_massive_scenario
名称: MTEB MassiveScenario分类 (zh-CN)
配置: zh-CN
拆分: 测试
修订: 7d571f92784cd94a019292a1f45445077d0ef634
指标:
- 类型: 准确率 值: 75.46738399462004
- 类型: F1分数 值: 75.02466838130249
- 任务:
类型: 检索
数据集:
类型: C-MTEB/MedicalRetrieval
名称: MTEB MedicalRetrieval
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP@1 值: 53.300000000000004
- 类型: MAP@10 值: 60.072
- 类型: MAP@100 值: 60.618
- 类型: MAP@1000 值: 60.659
- 类型: MAP@3 值: 58.550000000000004
- 类型: MAP@5 值: 59.425
- 类型: MRR@1 值: 53.5
- 类型: MRR@10 值: 60.187999999999995
- 类型: MRR@100 值: 60.73499999999999
- 类型: MRR@1000 值: 60.775999999999996
- 类型: MRR@3 值: 58.667
- 类型: MRR@5 值: 59.541999999999994
- 类型: NDCG@1 值: 53.300000000000004
- 类型: NDCG@10 值: 63.376999999999995
- 类型: NDCG@100 值: 66.24600000000001
- 类型: NDCG@1000 值: 67.408
- 类型: NDCG@3 值: 60.211000000000006
- 类型: NDCG@5 值: 61.781
- 类型: 精确率@1 值: 53.300000000000004
- 类型: 精确率@10 值: 7.380000000000001
- 类型: 精确率@100 值: 0.877
- 类型: 精确率@1000 值: 0.097
- 类型: 精确率@3 值: 21.667
- 类型: 精确率@5 值: 13.76
- 类型: 召回率@1 值: 53.300000000000004
- 类型: 召回率@10 值: 73.8
- 类型: 召回率@100 值: 87.7
- 类型: 召回率@1000 值: 97.0
- 类型: 召回率@3 值: 65.0
- 类型: 召回率@5 值: 68.8
- 任务:
类型: 分类
数据集:
类型: C-MTEB/MultilingualSentiment-classification
名称: MTEB 多语言情感
配置: 默认
拆分: 验证
修订: 无
指标:
- 类型: 准确率 值: 76.27666666666667
- 类型: F1分数 值: 76.31280038435165
- 任务:
类型: 对分类
数据集:
类型: C-MTEB/OCNLI
名称: MTEB Ocnli
配置: 默认
拆分: 验证
修订: 无
指标:
- 类型: 余弦相似度准确率 值: 78.72225230102869
- 类型: 余弦相似度AP 值: 80.63941899467723
- 类型: 余弦相似度F1 值: 80.52190121155638
- 类型: 余弦相似度精确率 值: 72.06005004170142
- 类型: 余弦相似度召回率 值: 91.23548046462513
- 类型: 点积准确率 值: 78.72225230102869
- 类型: 点积AP 值: 80.63913939812744
- 类型: 点积F1 值: 80.51948051948052
- 类型: 点积精确率 值: 71.7948717948718
- 类型: 点积召回率 值: 91.65786694825766
- 类型: 欧几里得准确率 值: 78.72225230102869
- 类型: 欧几里得AP 值: 80.64403797436798
- 类型: 欧几里得F1 值: 80.52190121155638
- 类型: 欧几里得精确率 值: 72.06005004170142
- 类型: 欧几里得召回率 值: 91.23548046462513
- 类型: 曼哈顿准确率 值: 78.18083378451544
- 类型: 曼哈顿AP 值: 80.5241189302444
- 类型: 曼哈顿F1 值: 80.43478260869566
- 类型: 曼哈顿精确率 值: 72.7972626176219
- 类型: 曼哈顿召回率 值: 89.86272439281943
- 类型: 最大准确率 值: 78.72225230102869
- 类型: 最大AP 值: 80.64403797436798
- 类型: 最大F1 值: 80.52190121155638
- 任务:
类型: 分类
数据集:
类型: C-MTEB/OnlineShopping-classification
名称: MTEB OnlineShopping
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 准确率 值: 92.49000000000001
- 类型: AP 值: 90.66330807324402
- 类型: F1分数 值: 92.48245049107115
- 任务:
类型: STS
数据集:
类型: C-MTEB/PAWSX
名称: MTEB PAWSX
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 33.6275431596535
- 类型: 余弦相似度斯皮尔曼 值: 37.865700050451494
- 类型: 欧几里得皮尔逊 值: 38.1050665279388
- 类型: 欧几里得斯皮尔曼 值: 37.864125056066364
- 类型: 曼哈顿皮尔逊 值: 38.11206873232881
- 类型: 曼哈顿斯皮尔曼 值: 37.852977098473936
- 任务:
类型: STS
数据集:
类型: C-MTEB/QBQTC
名称: MTEB QBQTC
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 32.137955501231104
- 类型: 余弦相似度斯皮尔曼 值: 33.68610910423116
- 类型: 欧几里得皮尔逊 值: 32.155444753547926
- 类型: 欧几里得斯皮尔曼 值: 33.685799252964124
- 类型: 曼哈顿皮尔逊 值: 32.14490855334317
- 类型: 曼哈顿斯皮尔曼 值: 33.656549820048554
- 任务:
类型: STS
数据集:
类型: mteb/sts22-crosslingual-sts
名称: MTEB STS22 (中文)
配置: zh
拆分: 测试
修订: 6d1ba47164174a496b7fa5d3569dae26a6813b80
指标:
- 类型: 余弦相似度皮尔逊 值: 63.63884916818661
- 类型: 余弦相似度斯皮尔曼 值: 64.3217581571435
- 类型: 欧几里得皮尔逊 值: 63.475760085926055
- 类型: 欧几里得斯皮尔曼 值: 64.31638169371887
- 类型: 曼哈顿皮尔逊 值: 64.39677572604752
- 类型: 曼哈顿斯皮尔曼 值: 64.85585019406021
- 任务:
类型: STS
数据集:
类型: C-MTEB/STSB
名称: MTEB STSB
配置: 默认
拆分: 测试
修订: 无
指标:
- 类型: 余弦相似度皮尔逊 值: 79.74698333415277
- 类型: 余弦相似度斯皮尔曼 值: 81.1850043859317
- 类型: 欧几里得皮尔逊 值: 80.94512578669881
- 类型: 欧几里得斯皮尔曼 值: 81.18825478390181
- 类型: 曼哈顿皮尔逊 值: 80.88114336824758
- 类型: 曼哈顿斯皮尔曼 值: 81.12266715583868
- 任务:
类型: 重排序
数据集:
类型: C-MTEB/T2Reranking
名称: MTEB T2Reranking
配置: 默认
拆分: 开发
修订: 无
指标:
- 类型: MAP 值: 66.
- 任务:
类型: STS
数据集:
类型: C-MTEB/AFQMC
名称: MTEB AFQMC
配置: 默认
拆分: 验证
修订: 无
指标:
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文