J
Jina Embeddings V3
由 jinaai 开发
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
下载量 3.7M
发布时间 : 9/5/2024
模型介绍
内容详情
替代品
模型简介
该模型是一个多语言句子嵌入模型,能够将文本转换为高维向量表示,用于计算句子相似度和特征提取。支持广泛的语言范围,适用于跨语言信息检索和语义相似度计算任务。
模型特点
多语言支持
支持超过100种语言,包括主流语言和多种小语种
句子嵌入
将句子转换为高维向量表示,便于计算语义相似度
特征提取
能够从文本中提取有意义的特征表示
模型能力
句子相似度计算
多语言文本嵌入
语义特征提取
跨语言信息检索
使用案例
信息检索
跨语言文档检索
在不同语言的文档集合中查找语义相似的内容
在MTEB ArguAna-PL数据集上达到50.12的主要得分
语义相似度
句子相似度计算
计算两个句子之间的语义相似度
在MTEB AFQMC数据集上达到43.47的斯皮尔曼相关系数
许可证:cc-by-nc-4.0
标签:
- 特征提取
- 句子相似度
- mteb
- sentence-transformers
语言:
- 多语言
- 南非荷兰语
- 阿姆哈拉语
- 阿拉伯语
- 阿萨姆语
- 阿塞拜疆语
- 白俄罗斯语
- 保加利亚语
- 孟加拉语
- 布列塔尼语
- 波斯尼亚语
- 加泰罗尼亚语
- 捷克语
- 威尔士语
- 丹麦语
- 德语
- 希腊语
- 英语
- 世界语
- 西班牙语
- 爱沙尼亚语
- 巴斯克语
- 波斯语
- 芬兰语
- 法语
- 弗里斯兰语
- 爱尔兰语
- 苏格兰盖尔语
- 加利西亚语
- 古吉拉特语
- 豪萨语
- 希伯来语
- 印地语
- 克罗地亚语
- 匈牙利语
- 亚美尼亚语
- 印度尼西亚语
- 冰岛语
- 意大利语
- 日语
- 爪哇语
- 格鲁吉亚语
- 哈萨克语
- 高棉语
- 卡纳达语
- 韩语
- 库尔德语
- 吉尔吉斯语
- 拉丁语
- 老挝语
- 立陶宛语
- 拉脱维亚语
- 马达加斯加语
- 马其顿语
- 马拉雅拉姆语
- 蒙古语
- 马拉地语
- 马来语
- 缅甸语
- 尼泊尔语
- 荷兰语
- 挪威语
- 奥罗莫语
- 奥里亚语
- 旁遮普语
- 波兰语
- 普什图语
- 葡萄牙语
- 罗马尼亚语
- 俄语
- 梵语
- 信德语
- 僧伽罗语
- 斯洛伐克语
- 斯洛文尼亚语
- 索马里语
- 阿尔巴尼亚语
- 塞尔维亚语
- 巽他语
- 瑞典语
- 斯瓦希里语
- 泰米尔语
- 泰卢固语
- 泰语
- 他加禄语
- 土耳其语
- 维吾尔语
- 乌克兰语
- 乌尔都语
- 乌兹别克语
- 越南语
- 科萨语
- 意第绪语
- 中文
推理:false
库名称:transformers
模型索引:
- 名称:jina-embeddings-v3
结果:-
数据集:
配置:默认
名称:MTEB AFQMC(默认)
修订:b44c3b011063adb25877c13823db83bb193913c4
拆分:验证
类型:C-MTEB/AFQMC
指标:- 类型:余弦皮尔逊
值:41.74237700998808 - 类型:余弦斯皮尔曼
值:43.4726782647566 - 类型:欧几里得皮尔逊
值:42.244585459479964 - 类型:欧几里得斯皮尔曼
值:43.525070045169606 - 类型:主要得分
值:43.4726782647566 - 类型:曼哈顿皮尔逊
值:42.04616728224863 - 类型:曼哈顿斯皮尔曼
值:43.308828270754645 - 类型:皮尔逊
值:41.74237700998808 - 类型:斯皮尔曼
值:43.4726782647566
任务:
类型:STS
- 类型:余弦皮尔逊
-
数据集:
配置:默认
名称:MTEB ArguAna-PL(默认)
修订:63fc86750af76253e8c760fc9e534bbf24d260a2
拆分:测试
类型:clarin-knext/arguana-pl
指标:- 类型:主要得分
值:50.117999999999995 - 类型:map_at_1
值:24.253 - 类型:map_at_10
值:40.725 - 类型:map_at_100
值:41.699999999999996 - 类型:map_at_1000
值:41.707 - 类型:map_at_20
值:41.467999999999996 - 类型:map_at_3
值:35.467 - 类型:map_at_5
值:38.291 - 类型:mrr_at_1
值:24.751066856330013 - 类型:mrr_at_10
值:40.91063808169072 - 类型:mrr_at_100
值:41.885497923928675 - 类型:mrr_at_1000
值:41.89301098419842 - 类型:mrr_at_20
值:41.653552355442514 - 类型:mrr_at_3
值:35.656709340919775 - 类型:mrr_at_5
值:38.466097676623946 - 类型:nauc_map_at_1000_diff1
值:7.503000359807567 - 类型:nauc_map_at_1000_max
值:-11.030405164830546 - 类型:nauc_map_at_1000_std
值:-8.902792782585117 - 类型:nauc_map_at_100_diff1
值:7.509899249593199 - 类型:nauc_map_at_100_max
值:-11.023581259404406 - 类型:nauc_map_at_100_std
值:-8.892241185067272 - 类型:nauc_map_at_10_diff1
值:7.24369711881512 - 类型:nauc_map_at_10_max
值:-10.810000200433278 - 类型:nauc_map_at_10_std
值:-8.987230542165776 - 类型:nauc_map_at_1_diff1
值:11.37175831832417 - 类型:nauc_map_at_1_max
值:-13.315221903223055 - 类型:nauc_map_at_1_std
值:-9.398199605510275 - 类型:nauc_map_at_20_diff1
值:7.477364530860648 - 类型:nauc_map_at_20_max
值:-10.901251218105566 - 类型:nauc_map_at_20_std
值:-8.868148116405925 - 类型:nauc_map_at_3_diff1
值:6.555548802174882 - 类型:nauc_map_at_3_max
值:-12.247274800542934 - 类型:nauc_map_at_3_std
值:-9.879475250984811 - 类型:nauc_map_at_5_diff1
值:7.426588563355882 - 类型:nauc_map_at_5_max
值:-11.347695686001805 - 类型:nauc_map_at_5_std
值:-9.34441892203972 - 类型:nauc_mrr_at_1000_diff1
值:5.99737552143614 - 类型:nauc_mrr_at_1000_max
值:-11.327205136505727 - 类型:nauc_mrr_at_1000_std
值:-8.791079115519503 - 类型:nauc_mrr_at_100_diff1
值:6.004622525255784 - 类型:nauc_mrr_at_100_max
值:-11.320336759899723 - 类型:nauc_mrr_at_100_std
值:-8.780602249831777 - 类型:nauc_mrr_at_10_diff1
值:5.783623516930227 - 类型:nauc_mrr_at_10_max
值:-11.095971693467078 - 类型:nauc_mrr_at_10_std
值:-8.877242032013582 - 类型:nauc_mrr_at_1_diff1
值:9.694937537703797 - 类型:nauc_mrr_at_1_max
值:-12.531905083727912 - 类型:nauc_mrr_at_1_std
值:-8.903992940100146 - 类型:nauc_mrr_at_20_diff1
值:5.984841206233873 - 类型:nauc_mrr_at_20_max
值:-11.195236951048969 - 类型:nauc_mrr_at_20_std
值:-8.757266039186018 - 类型:nauc_mrr_at_3_diff1
值:5.114333824261379 - 类型:nauc_mrr_at_3_max
值:-12.64809799843464 - 类型:nauc_mrr_at_3_std
值:-9.791146138025184 - 类型:nauc_mrr_at_5_diff1
值:5.88941606224512 - 类型:nauc_mrr_at_5_max
值:-11.763903418071918 - 类型:nauc_mrr_at_5_std
值:-9.279175712709446 - 类型:nauc_ndcg_at_1000_diff1
值:7.076950652226086 - 类型:nauc_ndcg_at_1000_max
值:-10.386482092087371 - 类型:nauc_ndcg_at_1000_std
值:-8.309190917074046 - 类型:nauc_ndcg_at_100_diff1
值:7.2329220284865245 - 类型:nauc_ndcg_at_100_max
值:-10.208048403220337 - 类型:nauc_ndcg_at_100_std
值:-7.997975874274613 - 类型:nauc_ndcg_at_10_diff1
值:6.065391100006953 - 类型:nauc_ndcg_at_10_max
值:-9.046164377601153 - 类型:nauc_ndcg_at_10_std
值:-8.34724889697153 - 类型:nauc_ndcg_at_1_diff1
值:11.37175831832417 - 类型:nauc_ndcg_at_1_max
值:-13.315221903223055 - 类型:nauc_ndcg_at_1_std
值:-9.398199605510275 - 类型:nauc_ndcg_at_20_diff1
值:6.949389989202601 - 类型:nauc_ndcg_at_20_max
值:-9.35740451760307 - 类型:nauc_ndcg_at_20_std
值:-7.761295171828212 - 类型:nauc_ndcg_at_3_diff1
值:5.051471796151364 - 类型:nauc_ndcg_at_3_max
值:-12.158763333711653 - 类型:nauc_ndcg_at_3_std
值:-10.078902544421926 - 类型:nauc_ndcg_at_5_diff1
值:6.527454512611454 - 类型:nauc_ndcg_at_5_max
值:-10.525118233848586 - 类型:nauc_ndcg_at_5_std
值:-9.120055125584031 - 类型:nauc_precision_at_1000_diff1
值:-10.6495668199151 - 类型:nauc_precision_at_1000_max
值:12.070656425217841 - 类型:nauc_precision_at_1000_std
值:55.844551709649004 - 类型:nauc_precision_at_100_diff1
值:19.206967129266285 - 类型:nauc_precision_at_100_max
值:16.296851020813456 - 类型:nauc_precision_at_100_std
值:45.60378984257811 - 类型:nauc_precision_at_10_diff1
值:0.6490335354304879 - 类型:nauc_precision_at_10_max
值:0.5757198255366447 - 类型:nauc_precision_at_10_std
值:-4.875847131691451 - 类型:nauc_precision_at_1_diff1
值:11.37175831832417 - 类型:nauc_precision_at_1_max
值:-13.315221903223055 - 类型:nauc_precision_at_1_std
值:-9.398199605510275 - 类型:nauc_precision_at_20_diff1
值:4.899369866929203 - 类型:nauc_precision_at_20_max
值:5.988537297189552 - 类型:nauc_precision_at_20_std
值:4.830900387582837 - 类型:nauc_precision_at_3_diff1
值:0.8791156910997744 - 类型:nauc_precision_at_3_max
值:-11.983373635905993 - 类型:nauc_precision_at_3_std
值:-10.646185111581257 - 类型:nauc_precision_at_5_diff1
值:3.9314486166548432 - 类型:nauc_precision_at_5_max
值:-7.798591396895839 - 类型:nauc_precision_at_5_std
值:-8.293043407234125 - 类型:nauc_recall_at_1000_diff1
值:-10.649566819918673 - 类型:nauc_recall_at_1000_max
值:12.070656425214647 - 类型:nauc_recall_at_1000_std
值:55.84455170965023 - 类型:nauc_recall_at_100_diff1
值:19.206967129265127 - 类型:nauc_recall_at_100_max
值:16.296851020813722 - 类型:nauc_recall_at_100_std
值:45.60378984257728 - 类型:nauc_recall_at_10_diff1
值:0.6490335354304176 - 类型:nauc_recall_at_10_max
值:0.5757198255366095 - 类型:nauc_recall_at_10_std
值:-4.875847131691468 - 类型:nauc_recall_at_1_diff1
值:11.37175831832417 - 类型:nauc_recall_at_1_max
值:-13.315221903223055 - 类型:nauc_recall_at_1_std
值:-9.398199605510275 - 类型:nauc_recall_at_20_diff1
值:4.899369866929402 - 类型:nauc_recall_at_20_max
值:5.98853729718968 - 类型:nauc_recall_at_20_std
值:4.830900387582967 - 类型:nauc_recall_at_3_diff1
值:0.8791156910997652 - 类型:nauc_recall_at_3_max
值:-11.983373635905997 - 类型:nauc_recall_at_3_std
值:-10.64618511158124 - 类型:nauc_recall_at_5_diff1
值:3.9314486166548472 - 类型:nauc_recall_at_5_max
值:-7.7985913968958585 - 类型:nauc_recall_at_5_std
值:-8.293043407234132 - 类型:ndcg_at_1
值:24.253 - 类型:ndcg_at_10
值:50.117999999999995 - 类型:ndcg_at_100
值:54.291999999999994 - 类型:ndcg_at_1000
值:54.44799999999999 - 类型:ndcg_at_20
值:52.771 - 类型:ndcg_at_3
值:39.296 - 类型:ndcg_at_5
值:44.373000000000005 - 类型:precision_at_1
值:24.253 - 类型:precision_at_10
值:8.016 - 类型:precision_at_100
值:0.984 - 类型:precision_at_1000
值:0.1 - 类型:precision_at_20
值:4.527 - 类型:precision_at_3
值:16.808999999999997 - 类型:precision_at_5
值:12.546 - 类型:recall_at_1
值:24.253 - 类型:recall_at_10
值:80.156 - 类型:recall_at_100
值:98.43499999999999 - 类型:recall_at_1000
值:99.57300000000001 - 类型:recall_at_20
值:90.54100000000001 - 类型:recall_at_3
值:50.427 - 类型:recall_at_5
值:62.731
任务:
类型:检索
- 类型:主要得分
-
数据集:
配置:默认
名称:MTEB DBPedia-PL(默认)
修订:76afe41d9af165cc40999fcaa92312b8b012064a
拆分:测试
类型:clarin-knext/dbpedia-pl
指标:- 类型:主要得分
值:34.827000000000005 - 类型:map_at_1
值:7.049999999999999 - 类型:map_at_10
值:14.982999999999999 - 类型:map_at_100
值:20.816000000000003 - 类型:map_at_1000
值:22.33 - 类型:map_at_20
值:17.272000000000002 - 类型:map_at_3
值:10.661 - 类型:map_at_5
值:12.498 - 类型:mrr_at_1
值:57.25 - 类型:mrr_at_10
值:65.81934523809524 - 类型:mrr_at_100
值:66.2564203928212 - 类型:mrr_at_1000
值:66.27993662923856 - 类型:mrr_at_20
值:66.0732139130649 - 类型:mrr_at_3
值:64.08333333333333 - 类型:mrr_at_5
值:65.27083333333333 - 类型:nauc_map_at_1000_diff1
值:16.41780871174038 - 类型:nauc_map_at_1000_max
值:30.193946325654654 - 类型:nauc_map_at_1000_std
值:31.46095497039037 - 类型:nauc_map_at_100_diff1
值:18.57903165498531 - 类型:nauc_map_at_100_max
值:29.541476938623262 - 类型:nauc_map_at_100_std
值:28.228604103301052 - 类型:nauc_map_at_10_diff1
值:24.109434489748946 - 类型:nauc_map_at_10_max
值:21.475954208048968 - 类型:nauc_map_at_10_std
值:9.964464537806988 - 类型:nauc_map_at_1_diff1
值:38.67437644802124 - 类型:nauc_map_at_1_max
值:14.52136658726491 - 类型:nauc_map_at_1_std
值:-2.8981666782088755 - 类型:nauc_map_at_20_diff1
值:21.42547228801935 - 类型:nauc_map_at_20_max
值:25.04510402960458 - 类型:nauc_map_at_20_std
值:16.533079346431155 - 类型:nauc_map_at_3_diff1
值:26.63648858245477 - 类型:nauc_map_at_3_max
值:13.632235789780415 - 类型:nauc_map_at_3_std
值:-0.40129174577700716 - 类型:nauc_map_at_5_diff1
值:24.513861031197933 - 类型:nauc_map_at_5_max
值:16.599888813946688 - 类型:nauc_map_at_5_std
值:3.4448514739556346 - 类型:nauc_mrr_at_1000_diff1
值:36.57353464537154 - 类型:nauc_mrr_at_1000_max
值:55.34763483979515 - 类型:nauc_mrr_at_1000_std
值:40.3722796438533 - 类型:nauc_mrr_at_100_diff1
值:36.555989566513134 - 类型:nauc_mrr_at_100_max
值:55.347805216808396 - 类型:nauc_mrr_at_100_std
值:40.38465945075711 - 类型:nauc_mrr_at_10_diff1
值:36.771572999261984 - 类型:nauc_mrr_at_10_max
值:55.41239897909165 - 类型:nauc_mrr_at_10_std
值:40.52058934624793 - 类型:nauc_mrr_at_1_diff1
值:38.2472828531032 - 类型:nauc_mrr_at_1_max
值:51.528473828685705 - 类型:nauc_mrr_at_1_std
值:33.03676467942882 - 类型:nauc_mrr_at_20_diff1
值:36.642602571889036 - 类型:nauc_mrr_at_20_max
值:55.3763342076553 - 类型:nauc_mrr_at_20_std
值:40.41520090500838 - 类型:nauc_mrr_at_3_diff1
值:36.79451847426628 - 类型:nauc_mrr_at_3_max
值:54.59778581826193 - 类型:nauc_mrr_at_3_std
值:39.48392075873095 - 类型:nauc_mrr_at_5_diff1
值:36.92150807529304 - 类型:nauc_mrr_at_5_max
值:55.03553978718272 - 类型:nauc_mrr_at_5_std
值:40.20147745489917 - 类型:nauc_ndcg_at_1000_diff1
值:21.843092744321268 - 类型:nauc_ndcg_at_1000_max
值:44.93275990394279 - 类型:nauc_ndcg_at_1000_std
值:47.09186225236347 - 类型:nauc_ndcg_at_100_diff1
值:25.180282568979095 - 类型:nauc_ndcg_at_100_max
值:41.737709709508394 - 类型:nauc_ndcg_at_100_std
值:38.80950644139446 - 类型:nauc_ndcg_at_10_diff1
值:24.108368037214046 - 类型:nauc_ndcg_at_10_max
值:41.29298370689967 - 类型:nauc_ndcg_at_10_std
值:35.06450769738732 - 类型:nauc_ndcg_at_1_diff1
值:35.51010679525079 - 类型:nauc_ndcg_at_1_max
值:42.40790024212412 - 类型:nauc_ndcg_at_1_std
值:26.696412036243157 - 类型:nauc_ndcg_at_20_diff1
值:23.909989673256195 - 类型:nauc_ndcg_at_20_max
值:39.78444647091927 - 类型:nauc_ndcg_at_20_std
值:33.39544470364529 - 类型:nauc_ndcg_at_3_diff1
值:22.50484297956035 - 类型:nauc_ndcg_at_3_max
值:39.14551926034168 - 类型:nauc_ndcg_at_3_std
值:30.330135925392014 - 类型:nauc_ndcg_at_5_diff1
值:21.7798872028265 - 类型:nauc_ndcg_at_5_max
值:40.23856975248015 - 类型:nauc_ndcg_at_5_std
值:32.438381067440396 - 类型:nauc_precision_at_1000_diff1
值:-21.62692442272279 - 类型:nauc_precision_at_1000_max
值:0.9689046974430882 - 类型:nauc_precision_at_1000_std
值:18.54001058230465 - 类型:nauc_precision_at_100_diff1
值:-10.132258779856192 - 类型:nauc_precision_at_100_max
值:23.74516110444681 - 类型:nauc_precision_at_100_std
值:47.03416663319965 - 类型:nauc_precision_at_10_diff1
值:1.543656509571949 - 类型:nauc_precision_at_10_max
值:36.98864812757555 - 类型:nauc_precision_at_10_std
值:46.56427199077426 - 类型:nauc_precision_at_1_diff1
值:38.2472828531032 - 类型:nauc_precision_at_1_max
值:51.528473828685705 - 类型:nauc_precision_at_1_std
值:33.03676467942882 - 类型:nauc_precision_at_20_diff1
值:-4.612864872734335 - 类型:nauc_precision_at_20_max
值:34.03565449182125 - 类型:nauc_precision_at_20_std
值:48.880727648349534 - 类型:nauc_precision_at_3_diff1
值:6.360850444467829 - 类型:nauc_precision_at_3_max
值:36.25816942368427 - 类型:nauc_precision_at_3_std
值:34.48882647419187 - 类型:nauc_precision_at_5_diff1
值:2.6445596936740037 - 类型:nauc_precision_at_5_max
值:37.174463388899056 - 类型:nauc_precision_at_5_std
值:40.25254370626113 - 类型:nauc_recall_at_1000_diff1
值:13.041227176748077 - 类型:nauc_recall_at_1000_max
值:39.722336427072094 - 类型:nauc_recall_at_1000_std
值:52.04032890059214 - 类型:nauc_recall_at_100_diff1
值:18.286096899139153 - 类型:nauc_recall_at_100_max
值:34.072389201930314 - 类型:nauc_recall_at_100_std
值:37.73637623416653 - 类型:nauc_recall_at_10_diff1
值:22.35560419280504 - 类型:nauc_recall_at_10_max
值:19.727247199595197 - 类型:nauc_recall_at_10_std
值:8.58498575109203 - 类型:nauc_recall_at_1_diff1
值:38.67437644802124 - 类型:nauc_recall_at_1_max
值:14.52136658726491 - 类型:nauc_recall_at_1_std
值:-2.8981666782088755 - 类型:nauc_recall_at_20_diff1
值:19.026320886902916 - 类型:nauc_recall_at_20_max
值:22.753562309469867 - 类型:nauc_recall_at_20_std
值:14.89994263882445 - 类型:nauc_recall_at_3_diff1
值:23.428129702129684 - 类型:nauc_recall_at_3_max
值:10.549153954790542 - 类型:nauc_recall_at_3_std
值:-1.7590608997055206 - 类型:nauc_recall_at_5_diff1
值:21.27448645803921 - 类型:nauc_recall_at_5_max
值:13.620279707461677 - 类型:nauc_recall_at_5_std
值:2.0577962208292675 - 类型:ndcg_at_1
值:46.75 - 类型:ndcg_at_10
值:34.827000000000005 - 类型:ndcg_at_100
值:38.157999999999994 - 类型:ndcg_at_1000
值:44.816 - 类型:ndcg_at_20
值:34.152 - 类型:ndcg_at_3
值:39.009 - 类型:ndcg_at_5
值:36.826 - 类型:precision_at_1
值:57.25 - 类型:precision_at_10
值:27.575 - 类型:precision_at_100
值:8.84 - 类型:precision_at_1000
值:1.949 - 类型:precision_at_20
值:20.724999999999998 - 类型:precision_at_3
值:41.167 - 类型:precision_at_5
值:35.199999999999996 - 类型:recall_at_1
值:7.049999999999999 - 类型:recall_at_10
值:19.817999999999998 - 类型:recall_at_100
值:42.559999999999995 - 类型:recall_at_1000
值:63.744 - 类型:recall_at_20
值:25.968000000000004 - 类型:recall_at_3
值:11.959 - 类型:recall_at_5
值:14.939
任务:
类型:检索
- 类型:主要得分
-
数据集:
配置:默认
名称:MTEB FiQA-PL(默认)
修订:2e535829717f8bf9dc829b7f911cc5bbd4e6608e
拆分:测试
类型:clarin-knext/fiqa-pl
指标:- 类型:主要得分
值:38.828 - 类型:map_at_1
值:19.126 - 类型:map_at_10
值:31.002000000000002 - 类型:map_at_100
值:32.736 - 类型:map_at_1000
值:32.933 - 类型:map_at_20
值:31.894 - 类型:map_at_3
值
- 类型:主要得分
-
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文