S
Snowflake Arctic Embed M V2.0
由 Snowflake 开发
Snowflake Arctic Embed M v2.0 是一个多语言句子嵌入模型,支持超过50种语言,专注于句子相似度和特征提取任务。
下载量 92.30k
发布时间 : 11/8/2024
模型介绍
内容详情
替代品
模型简介
该模型是一个高效的句子转换器,能够将文本转换为高质量的嵌入向量,适用于多种自然语言处理任务,如句子相似度计算、信息检索和文本分类。
模型特点
多语言支持
支持超过50种语言,适用于全球化的应用场景。
高性能句子嵌入
能够生成高质量的句子嵌入向量,适用于多种自然语言处理任务。
广泛的评估基准
在MTEB等多个基准测试中表现出色,涵盖分类、聚类、检索等多种任务。
模型能力
句子相似度计算
特征提取
文本分类
信息检索
文本聚类
使用案例
电子商务
产品评论分类
对亚马逊等电商平台的产品评论进行分类,识别正面和负面评价。
在亚马逊极性分类任务中达到70.36%的准确率。
客户支持
重复问题检测
识别客户支持平台中的重复问题,提高支持效率。
在AskUbuntu重复问题任务中MAP达到60.65%。
学术研究
论文聚类
对学术论文进行聚类,帮助研究人员发现相关研究。
在论文聚类P2P任务中V度量达到44.68%。
pipeline_tag: 句子相似度 tags:
- 句子转换器
- 特征提取
- 句子相似度
- MTEB
- Arctic
- Snowflake-Arctic-Embed
- Transformers.js license: Apache-2.0 language:
- 南非荷兰语
- 阿拉伯语
- 阿塞拜疆语
- 白俄罗斯语
- 保加利亚语
- 孟加拉语
- 加泰罗尼亚语
- 宿务语
- 捷克语
- 威尔士语
- 丹麦语
- 德语
- 希腊语
- 英语
- 西班牙语
- 爱沙尼亚语
- 巴斯克语
- 波斯语
- 芬兰语
- 法语
- 加利西亚语
- 古吉拉特语
- 希伯来语
- 印地语
- 克罗地亚语
- 海地克里奥尔语
- 匈牙利语
- 亚美尼亚语
- 印尼语
- 冰岛语
- 意大利语
- 日语
- 爪哇语
- 格鲁吉亚语
- 哈萨克语
- 高棉语
- 卡纳达语
- 韩语
- 吉尔吉斯语
- 老挝语
- 立陶宛语
- 拉脱维亚语
- 马其顿语
- 马拉雅拉姆语
- 蒙古语
- 马拉地语
- 马来语
- 缅甸语
- 尼泊尔语
- 荷兰语
- 旁遮普语
- 波兰语
- 葡萄牙语
- 克丘亚语
- 罗马尼亚语
- 俄语
- 僧伽罗语
- 斯洛伐克语
- 斯洛文尼亚语
- 索马里语
- 阿尔巴尼亚语
- 塞尔维亚语
- 瑞典语
- 斯瓦希里语
- 泰米尔语
- 泰卢固语
- 泰语
- 他加禄语
- 土耳其语
- 乌克兰语
- 乌尔都语
- 越南语
- 约鲁巴语
- 中文 model-index:
- name: snowflake-arctic-embed-m-v2.0
results:
- dataset:
config: en-ext
name: MTEB 亚马逊反事实分类 (en-ext)
revision: e8379541af4e31359cca9fbcf4b00f2671dba205
split: 测试集
type: mteb/amazon_counterfactual
metrics:
- type: 准确率 value: 66.6867
- type: F1分数 value: 55.0373
- type: 加权F1分数 value: 73.07430000000001
- type: 平均精度 value: 18.077399999999997
- type: 加权平均精度 value: 18.077399999999997
- type: 主要分数 value: 66.6867 task: type: 分类
- dataset:
config: en
name: MTEB 亚马逊反事实分类 (en)
revision: e8379541af4e31359cca9fbcf4b00f2671dba205
split: 测试集
type: mteb/amazon_counterfactual
metrics:
- type: 准确率 value: 66.194
- type: F1分数 value: 60.854299999999995
- type: 加权F1分数 value: 69.57339999999999
- type: 平均精度 value: 30.279099999999996
- type: 加权平均精度 value: 30.279099999999996
- type: 主要分数 value: 66.194 task: type: 分类
- dataset:
config: default
name: MTEB 亚马逊极性分类 (default)
revision: e2d317d38cd51312af73b3d32a06d1a08b442046
split: 测试集
type: mteb/amazon_polarity
metrics:
- type: 准确率 value: 70.3589
- type: F1分数 value: 70.0409
- type: 加权F1分数 value: 70.0409
- type: 平均精度 value: 64.81949999999999
- type: 加权平均精度 value: 64.81949999999999
- type: 主要分数 value: 70.3589 task: type: 分类
- dataset:
config: en
name: MTEB 亚马逊评论分类 (en)
revision: 1399c76144fd37290681b995c656ef9b2e06e26d
split: 测试集
type: mteb/amazon_reviews_multi
metrics:
- type: 准确率 value: 33.766
- type: F1分数 value: 33.3656
- type: 加权F1分数 value: 33.3656
- type: 主要分数 value: 33.766 task: type: 分类
- dataset:
config: default
name: MTEB ArguAna (default)
revision: c22ab2a51041ffd869aaddef7af8d8215647e41a
split: 测试集
type: mteb/arguana
metrics:
- type: NDCG@1 value: 33.144
- type: NDCG@3 value: 47.909
- type: NDCG@5 value: 52.932
- type: NDCG@10 value: 58.011
- type: NDCG@20 value: 60.168
- type: NDCG@100 value: 60.928000000000004
- type: NDCG@1000 value: 61.046
- type: MAP@1 value: 33.144
- type: MAP@3 value: 44.156
- type: MAP@5 value: 46.951
- type: MAP@10 value: 49.071999999999996
- type: MAP@20 value: 49.692
- type: MAP@100 value: 49.809
- type: MAP@1000 value: 49.815
- type: 召回率@1 value: 33.144
- type: 召回率@3 value: 58.819
- type: 召回率@5 value: 70.982
- type: 召回率@10 value: 86.558
- type: 召回率@20 value: 94.879
- type: 召回率@100 value: 98.791
- type: 召回率@1000 value: 99.644
- type: 精确率@1 value: 33.144
- type: 精确率@3 value: 19.606
- type: 精确率@5 value: 14.196
- type: 精确率@10 value: 8.656
- type: 精确率@20 value: 4.744000000000001
- type: 精确率@100 value: 0.988
- type: 精确率@1000 value: 0.1
- type: MRR@1 value: 33.4993
- type: MRR@3 value: 44.393100000000004
- type: MRR@5 value: 47.131299999999996
- type: MRR@10 value: 49.264599999999994
- type: MRR@20 value: 49.8707
- type: MRR@100 value: 49.987700000000004
- type: MRR@1000 value: 49.993700000000004
- type: NAUC_NDCG@1_max value: -10.8287
- type: NAUC_NDCG@1_std value: -17.1177
- type: NAUC_NDCG@1_diff1 value: 14.4508
- type: NAUC_NDCG@3_max value: -7.7004
- type: NAUC_NDCG@3_std value: -16.6705
- type: NAUC_NDCG@3_diff1 value: 10.0448
- type: NAUC_NDCG@5_max value: -7.0436
- type: NAUC_NDCG@5_std value: -15.8744
- type: NAUC_NDCG@5_diff1 value: 9.1132
- type: NAUC_NDCG@10_max value: -7.4729
- type: NAUC_NDCG@10_std value: -14.9349
- type: NAUC_NDCG@10_diff1 value: 8.527700000000001
- type: NAUC_NDCG@20_max value: -6.997000000000001
- type: NAUC_NDCG@20_std value: -14.688399999999998
- type: NAUC_NDCG@20_diff1 value: 9.7605
- type: NAUC_NDCG@100_max value: -7.5599
- type: NAUC_NDCG@100_std value: -15.0565
- type: NAUC_NDCG@100_diff1 value: 10.2688
- type: NAUC_NDCG@1000_max value: -7.675800000000001
- type: NAUC_NDCG@1000_std value: -15.223500000000001
- type: NAUC_NDCG@1000_diff1 value: 10.32
- type: NAUC_MAP@1_max value: -10.8287
- type: NAUC_MAP@1_std value: -17.1177
- type: NAUC_MAP@1_diff1 value: 14.4508
- type: NAUC_MAP@3_max value: -8.5473
- type: NAUC_MAP@3_std value: -16.6674
- type: NAUC_MAP@3_diff1 value: 11.1004
- type: NAUC_MAP@5_max value: -8.1927
- type: NAUC_MAP@5_std value: -16.2275
- type: NAUC_MAP@5_diff1 value: 10.678600000000001
- type: NAUC_MAP@10_max value: -8.3855
- type: NAUC_MAP@10_std value: -15.8309
- type: NAUC_MAP@10_diff1 value: 10.5414
- type: NAUC_MAP@20_max value: -8.277700000000001
- type: NAUC_MAP@20_std value: -15.824
- type: NAUC_MAP@20_diff1 value: 10.8494
- type: NAUC_MAP@100_max value: -8.3178
- type: NAUC_MAP@100_std value: -15.848300000000002
- type: NAUC_MAP@100_diff1 value: 10.9384
- type: NAUC_MAP@1000_max value: -8.319799999999999
- type: NAUC_MAP@1000_std value: -15.8522
- type: NAUC_MAP@1000_diff1 value: 10.9401
- type: NAUC_召回率@1_max value: -10.8287
- type: NAUC_召回率@1_std value: -17.1177
- type: NAUC_召回率@1_diff1 value: 14.4508
- type: NAUC_召回率@3_max value: -5.0587
- type: NAUC_召回率@3_std value: -16.730800000000002
- type: NAUC_召回率@3_diff1 value: 6.8079
- type: NAUC_召回率@5_max value: -2.6783
- type: NAUC_召回率@5_std value: -14.5046
- type: NAUC_召回率@5_diff1 value: 3.096
- type: NAUC_召回率@10_max value: -1.5855000000000001
- type: NAUC_召回率@10_std value: -8.2276
- type: NAUC_召回率@10_diff1 value: -6.1741
- type: NAUC_召回率@20_max value: 15.754299999999999
- type: NAUC_召回率@20_std value: 8.1974
- type: NAUC_召回率@20_diff1 value: -4.9207
- type: NAUC_召回率@100_max value: 20.4574
- type: NAUC_召回率@100_std value: 36.3741
- type: NAUC_召回率@100_diff1 value: -7.9483
- type: NAUC_召回率@1000_max value: 21.6023
- type: NAUC_召回率@1000_std value: 68.7296
- type: NAUC_召回率@1000_diff1 value: -24.9261
- type: NAUC_精确率@1_max value: -10.8287
- type: NAUC_精确率@1_std value: -17.1177
- type: NAUC_精确率@1_diff1 value: 14.4508
- type: NAUC_精确率@3_max value: -5.0587
- type: NAUC_精确率@3_std value: -16.730800000000002
- type: NAUC_精确率@3_diff1 value: 6.8079
- type: NAUC_精确率@5_max value: -2.6783
- type: NAUC_精确率@5_std value: -14.5046
- type: NAUC_精确率@5_diff1 value: 3.096
- type: NAUC_精确率@10_max value: -1.5855000000000001
- type: NAUC_精确率@10_std value: -8.2276
- type: NAUC_精确率@10_diff1 value: -6.1741
- type: NAUC_精确率@20_max value: 15.754299999999999
- type: NAUC_精确率@20_std value: 8.1974
- type: NAUC_精确率@20_diff1 value: -4.9207
- type: NAUC_精确率@100_max value: 20.4574
- type: NAUC_精确率@100_std value: 36.3741
- type: NAUC_精确率@100_diff1 value: -7.9483
- type: NAUC_精确率@1000_max value: 21.6023
- type: NAUC_精确率@1000_std value: 68.7296
- type: NAUC_精确率@1000_diff1 value: -24.9261
- type: NAUC_MRR@1_max value: -11.251999999999999
- type: NAUC_MRR@1_std value: -17.4386
- type: NAUC_MRR@1_diff1 value: 13.414200000000001
- type: NAUC_MRR@3_max value: -9.7985
- type: NAUC_MRR@3_std value: -16.650000000000002
- type: NAUC_MRR@3_diff1 value: 9.5099
- type: NAUC_MRR@5_max value: -9.064
- type: NAUC_MRR@5_std value: -16.4409
- type: NAUC_MRR@5_diff1 value: 9.4773
- type: NAUC_MRR@10_max value: -9.310400000000001
- type: NAUC_MRR@10_std value: -16.0546
- type: NAUC_MRR@10_diff1 value: 9.2528
- type: NAUC_MRR@20_max value: -9.223099999999999
- type: NAUC_MRR@20_std value: -16.0659
- type: NAUC_MRR@20_diff1 value: 9.5259
- type: NAUC_MRR@100_max value: -9.2678
- type: NAUC_MRR@100_std value: -16.0911
- type: NAUC_MRR@100_diff1 value: 9.608600000000001
- type: NAUC_MRR@1000_max value: -9.2699
- type: NAUC_MRR@1000_std value: -16.095100000000002
- type: NAUC_MRR@1000_diff1 value: 9.6099
- type: 主要分数 value: 58.011 task: type: 检索
- dataset:
config: default
name: MTEB 论文聚类P2P (default)
revision: a122ad7f3f0291bf49cc6f4d32aa80929df69d5d
split: 测试集
type: mteb/arxiv-clustering-p2p
metrics:
- type: V度量 value: 44.684400000000004
- type: V度量标准差 value: 13.5064
- type: 主要分数 value: 44.684400000000004 task: type: 聚类
- dataset:
config: default
name: MTEB 论文聚类S2S (default)
revision: f910caf1a6075f7329cdf8c1a6135696f37dbd53
split: 测试集
type: mteb/arxiv-clustering-s2s
metrics:
- type: V度量 value: 35.0503
- type: V度量标准差 value: 13.9543
- type: 主要分数 value: 35.0503 task: type: 聚类
- dataset:
config: default
name: MTEB AskUbuntu重复问题 (default)
revision: 2000358ca161889fa9c082cb41daa8dcfb161a54
split: 测试集
type: mteb/askubuntudupquestions-reranking
metrics:
- type: MAP value: 60.648500000000006
- type: MRR value: 74.528
- type: nAUC_map_max value: 19.4239
- type: nAUC_map_std value: 20.0729
- type: nAUC_map_diff1 value: 10.0382
- type: nAUC_mrr_max value: 30.693199999999997
- type: nAUC_mrr_std value: 27.1279
- type: nAUC_mrr_diff1 value: 23.0291
- type: 主要分数 value: 60.648500000000006 task: type: 重排序
- dataset:
config: default
name: MTEB BIOSSES (default)
revision: d3fb88f8f02e40887cd149695127462bbcf29b4a
split: 测试集
type: mteb/biosses-sts
metrics:
- type: 皮尔逊相关系数 value: 89.5081
- type: 斯皮尔曼相关系数 value: 87.0568
- type: 余弦皮尔逊相关系数 value: 89.5081
- type: 余弦斯皮尔曼相关系数 value: 87.0568
- type: 曼哈顿皮尔逊相关系数 value: 88.1247
- type: 曼哈顿斯皮尔曼相关系数 value: 87.2556
- type: 欧几里得皮尔逊相关系数 value: 88.3266
- type: 欧几里德斯皮尔曼相关系数 value: 87.0568
- type: 主要分数 value: 87.0568 task: type: 语义文本相似度
- dataset:
config: default
name: MTEB Banking77分类 (default)
revision: 0fd18e25b25c072e09e0d92ab615fda904d66300
split: 测试集
type: mteb/banking77
metrics:
- type: 准确率 value: 80.18180000000001
- type: F1分数 value: 79.5538
- type: 加权F1分数 value: 79.5538
- type: 主要分数 value: 80.18180000000001 task: type: 分类
- dataset:
config: default
name: MTEB Biorxiv聚类P2P (default)
revision: 65b79d1d13f80053f67aca9498d9402c2d9f1f40
split: 测试集
type: mteb/biorxiv-clustering-p2p
metrics:
- type: V度量 value: 36.0126
- type: V度量标准差 value: 0.47019999999999995
- type: 主要分数 value: 36.0126 task: type: 聚类
- dataset:
config: default
name: MTEB Biorxiv聚类S2S (default)
revision: 258694dd0231531bc1fd9de6ceb52a0853c6d908
split: 测试集
type: mteb/biorxiv-clustering-s2s
metrics:
- type: V度量 value: 28.6331
- type: V度量标准差 value: 0.8607999999999999
- type: 主要分数 value: 28.6331 task: type: 聚类
- dataset:
config: default
name: MTEB CQADupstackAndroid检索 (default)
revision: f46a197baaae43b4f621051089b82a364682dfeb
split: 测试集
type: mteb/cqadupstack-android
metrics:
- type: NDCG@1 value: 45.207
- type: NDCG@3 value: 51.31400000000001
- type: NDCG@5 value: 54.093999999999994
- type: NDCG@10 value: 56.31
- type: NDCG@20 value: 58.378
- type: NDCG@100 value: 61.307
- type: NDCG@1000 value: 62.724999999999994
- type: MAP@1 value: 37.732
- type: MAP@3 value: 46.263
- type: MAP@5 value: 48.553000000000004
- type: MAP@10 value: 49.984
- type: MAP@20 value: 50.888999999999996
- type: MAP@100 value: 51.568999999999996
- type: MAP@1000 value: 51.666999999999994
- type: 召回率@1 value: 37.732
- type: 召回率@3 value: 53.736
- type: 召回率@5 value: 60.95399999999999
- type: 召回率@10 value: 68.062
- type: 召回率@20 value: 75.149
- type: 召回率@100 value: 88.075
- type: 召回率@1000 value: 96.878
- type: 精确率@1 value: 45.207
- type: 精确率@3 value: 24.368000000000002
- type: 精确率@5 value: 17.854
- type: 精确率@10 value: 10.558
- type: 精确率@20 value: 6.23
- type: 精确率@100 value: 1.614
- type: 精确率@1000 value: 0.202
- type: MRR@1 value: 45.2074
- type: MRR@3 value: 52.9804
- type: MRR@5 value: 54.718599999999995
- type: MRR@10 value: 55.5713
- type: MRR@20 value: 55.94
- type: MRR@100 value: 56.21699999999999
- type: MRR@1000 value: 56.2504
- type: NAUC_NDCG@1_max value: 43.7697
- type: NAUC_NDCG@1_std value: -3.9530000000000003
- type: NAUC_NDCG@1_diff1 value: 57.75320000000001
- type: NAUC_NDCG@3_max value: 42.7238
- type: NAUC_NDCG@3_std value: -3.5654
- type: NAUC_NDCG@3_diff1 value: 53.552299999999995
- type: NAUC_NDCG@5_max value: 43.115500000000004
- type: NAUC_NDCG@5_std value: -2.1444
- type: NAUC_NDCG@5_diff1 value: 53.130500000000005
- type: NAUC_NDCG@10_max value: 43.0188
- type: NAUC_NDCG@10_std value: -3.1515
- type: NAUC_NDCG@10_diff1 value: 53.593199999999996
- type: NAUC_NDCG@20_max value: 43.4617
- type: NAUC_NDCG@20_std value: -2.9284
- type: NAUC_NDCG@20_diff1 value: 53.28000000000001
- type: NAUC_NDCG@100_max value: 44.0704
- type: NAUC_NDCG@100_std value: -0.5772
- type: NAUC_NDCG@100_diff1 value: 53.439899999999994
- type: NAUC_NDCG@1000_max value: 44.256099999999996
- type: NAUC_NDCG@1000_std value: -1.1407
- type: NAUC_NDCG@1000_diff1 value: 53.8728
- type: NAUC_MAP@1_max value: 36.613800000000005
- type: NAUC_MAP@1_std value: -5.8014
- type: NAUC_MAP@1_diff1 value: 59.0186
- type: NAUC_MAP@3_max value: 40.8666
- type: NAUC_MAP@3_std value: -4.886299999999999
- type: NAUC_MAP@3_diff1 value: 55.324600000000004
- type: NAUC_MAP@5_max value: 41.9942
- type: NAUC_MAP@5_std value: -3.9361
- type: NAUC_MAP@5_diff1 value: 54.8805
- type: NAUC_MAP@10_max value: 42.1621
- type: NAUC_MAP@10_std value: -4.3264
- type: NAUC_MAP@10_diff1 value: 55.0133
- type: NAUC_MAP@20_max value: 42.5837
- type: NAUC_MAP@20_std value: -3.8526
- type: NAUC_MAP@20_diff1 value: 54.895700000000005
- type: NAUC_MAP@100_max value: 42.7645
- type: NAUC_MAP@100_std value: -3.4568000000000003
- type: NAUC_MAP@100_diff1 value: 54.98030000000001
- type: NAUC_MAP@1000_max value: 42.7915
- type: NAUC_MAP@1000_std value: -3.4715999999999996
- type: NAUC_MAP@1000_diff1 value: 55.0117
- type: NAUC_召回率@1_max value: 36.613800000000005
- type: NAUC_召回率@1_std value: -5.8014
- type: NAUC_召回率@1_diff1 value: 59.0186
- type: NAUC_召回率@3_max value: 39.3588
- type: NAUC_召回率@3_std value: -3.29
- type: NAUC_召回率@3_diff1 value: 50.1633
- type: NAUC_召回率@5_max value: 39.7596
- type: NAUC_召回率@5_std value: 0.4483
- type: NAUC_召回率@5_diff1 value: 47.598600000000005
- type: NAUC_召回率@10_max value: 37.5367
- type: NAUC_召回率@10_std value: -2.5935
- type: NAUC_召回率@10_diff1 value: 46.824799999999996
- type: NAUC_召回率@20_max value: 38.521100000000004
- type: NAUC_召回率@20_std value: -2.5774
- type: NAUC_召回率@20_diff1 value: 44.099
- type: NAUC_召回率@100_max value: 44.043
- type: NAUC_召回率@100_std value: 22.724
- type: NAUC_召回率@100_diff1 value: 40.4973
- type: NAUC_召回率@1000_max value: 59.780100000000004
- type: NAUC_召回率@1000_std value: 52.512
- type: NAUC_召回率@1000_diff1 value: 45.2841
- type: NAUC_精确率@1_max value: 43.7697
- type: NAUC_精确率@1_std value: -3.9530000000000003
- type: NAUC_精确率@1_diff1 value: 57.75320000000001
- type: NAUC_精确率@3_max value: 37.486000000000004
- type: NAUC_精确率@3_std value: -1.0619
- type: NAUC_精确率@3_diff1 value: 28.264699999999998
- type: NAUC_精确率@5_max value: 31.613599999999998
- type: NAUC_精确率@5_std value: 3.6863
- type: NAUC_精确率@5_diff1 value: 16.0838
- type: NAUC_精确率@10_max value: 23.4082
- type: NAUC_精确率@10_std value: 3.3977
- type: NAUC_精确率@10_diff1 value: 7.3632
- type: NAUC_精确率@20_max value: 16.7236
- type: NAUC
- dataset:
config: en-ext
name: MTEB 亚马逊反事实分类 (en-ext)
revision: e8379541af4e31359cca9fbcf4b00f2671dba205
split: 测试集
type: mteb/amazon_counterfactual
metrics:
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文