模型介绍
内容详情
替代品
模型简介
该模型主要用于句子相似度计算和特征提取,在MTEB(Massive Text Embedding Benchmark)多个任务上表现出色,支持多种语言和跨语言任务。
模型特点
多语言支持
支持多种语言的句子相似度计算和特征提取,包括英语、德语、法语、西班牙语、日语和中文等。
高性能
在MTEB多个任务上表现优异,尤其在句子相似度和分类任务中取得高分。
NLI微调
通过自然语言推理(NLI)任务微调,提升了模型在句子相似度和语义理解方面的能力。
模型能力
句子相似度计算
特征提取
文本分类
跨语言文本挖掘
语义检索
使用案例
电子商务
产品评论分类
用于对亚马逊等电商平台的产品评论进行情感分析和分类。
在MTEB Amazon极性分类任务中达到82.31%的准确率。
信息检索
问答系统
用于问答系统中的相似问题检索和答案匹配。
在AskUbuntu重复问题任务中达到55.90的平均精度。
跨语言应用
双语文本挖掘
用于跨语言文本匹配和对齐任务。
在BUCC德语-英语任务中达到75.49%的准确率。
pipeline_tag: 句子相似度 tags:
- 句子转换器
- 特征提取
- 句子相似度
- MTEB model-index:
- name: SGPT-5.8B加权平均NLI微调
results:
- task:
type: 分类
dataset:
type: mteb/amazon_counterfactual
name: MTEB Amazon反事实分类 (en)
config: en
split: 测试集
revision: 2d8a100785abf0ae21420d2a55b0c56e3e1ea996
metrics:
- type: 准确率 value: 74.07462686567165
- type: 平均精度 value: 37.44692407529112
- type: F1分数 value: 68.28971003916419
- task:
type: 分类
dataset:
type: mteb/amazon_counterfactual
name: MTEB Amazon反事实分类 (de)
config: de
split: 测试集
revision: 2d8a100785abf0ae21420d2a55b0c56e3e1ea996
metrics:
- type: 准确率 value: 66.63811563169165
- type: 平均精度 value: 78.57252079915924
- type: F1分数 value: 64.5543087846584
- task:
type: 分类
dataset:
type: mteb/amazon_counterfactual
name: MTEB Amazon反事实分类 (en-ext)
config: en-ext
split: 测试集
revision: 2d8a100785abf0ae21420d2a55b0c56e3e1ea996
metrics:
- type: 准确率 value: 77.21889055472263
- type: 平均精度 value: 25.663426367826712
- type: F1分数 value: 64.26265688503176
- task:
type: 分类
dataset:
type: mteb/amazon_counterfactual
name: MTEB Amazon反事实分类 (ja)
config: ja
split: 测试集
revision: 2d8a100785abf0ae21420d2a55b0c56e3e1ea996
metrics:
- type: 准确率 value: 58.06209850107067
- type: 平均精度 value: 14.028219107023915
- type: F1分数 value: 48.10387189660778
- task:
type: 分类
dataset:
type: mteb/amazon_polarity
name: MTEB Amazon极性分类
config: 默认
split: 测试集
revision: 80714f8dcf8cefc218ef4f8c5a966dd83f75a0e1
metrics:
- type: 准确率 value: 82.30920000000002
- type: 平均精度 value: 76.88786578621213
- type: F1分数 value: 82.15455656065011
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (en)
config: en
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 41.584
- type: F1分数 value: 41.203137944390114
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (de)
config: de
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 35.288000000000004
- type: F1分数 value: 34.672995558518096
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (es)
config: es
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 38.34
- type: F1分数 value: 37.608755629529455
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (fr)
config: fr
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 37.839999999999996
- type: F1分数 value: 36.86898201563507
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (ja)
config: ja
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 30.936000000000003
- type: F1分数 value: 30.49401738527071
- task:
type: 分类
dataset:
type: mteb/amazon_reviews_multi
name: MTEB Amazon评论分类 (zh)
config: zh
split: 测试集
revision: c379a6705fec24a2493fa68e011692605f44e119
metrics:
- type: 准确率 value: 33.75
- type: F1分数 value: 33.38338946025617
- task:
type: 检索
dataset:
type: arguana
name: MTEB ArguAna
config: 默认
split: 测试集
revision: 5b3e3697907184a9b77a3c99ee9ea1a9cbb1e4e3
metrics:
- type: 首位平均精度 value: 13.727
- type: 前十平均精度 value: 26.740000000000002
- type: 前百平均精度 value: 28.218
- type: 前千平均精度 value: 28.246
- type: 前三平均精度 value: 21.728
- type: 前五平均精度 value: 24.371000000000002
- type: 首位标准化折损累积增益 value: 13.727
- type: 前十标准化折损累积增益 value: 35.07
- type: 前百标准化折损累积增益 value: 41.947
- type: 前千标准化折损累积增益 value: 42.649
- type: 前三标准化折损累积增益 value: 24.484
- type: 前五标准化折损累积增益 value: 29.282999999999998
- type: 首位精确率 value: 13.727
- type: 前十精确率 value: 6.223
- type: 前百精确率 value: 0.9369999999999999
- type: 前千精确率 value: 0.099
- type: 前三精确率 value: 10.835
- type: 前五精确率 value: 8.848
- type: 首位召回率 value: 13.727
- type: 前十召回率 value: 62.233000000000004
- type: 前百召回率 value: 93.67
- type: 前千召回率 value: 99.14699999999999
- type: 前三召回率 value: 32.504
- type: 前五召回率 value: 44.239
- task:
type: 聚类
dataset:
type: mteb/arxiv-clustering-p2p
name: MTEB Arxiv聚类P2P
config: 默认
split: 测试集
revision: 0bbdb47bcbe3a90093699aefeed338a0f28a7ee8
metrics:
- type: V度量 value: 40.553923271901695
- task:
type: 聚类
dataset:
type: mteb/arxiv-clustering-s2s
name: MTEB Arxiv聚类S2S
config: 默认
split: 测试集
revision: b73bd54100e5abfa6e3a23dcafb46fe4d2438dc3
metrics:
- type: V度量 value: 32.49323183712211
- task:
type: 重排序
dataset:
type: mteb/askubuntudupquestions-reranking
name: MTEB AskUbuntu重复问题
config: 默认
split: 测试集
revision: 4d853f94cd57d85ec13805aeeac3ae3e5eb4c49c
metrics:
- type: 平均精度 value: 55.89811361443445
- type: 平均倒数排名 value: 70.16235764850724
- task:
type: 语义文本相似度
dataset:
type: mteb/biosses-sts
name: MTEB BIOSSES
config: 默认
split: 测试集
revision: 9ee918f184421b6bd48b78f6c714d86546106103
metrics:
- type: 余弦相似度皮尔逊 value: 82.50506557805856
- type: 余弦相似度斯皮尔曼 value: 79.50000423261176
- type: 欧氏距离皮尔逊 value: 75.76190885392926
- type: 欧氏距离斯皮尔曼 value: 76.7330737163434
- type: 曼哈顿距离皮尔逊 value: 75.825318036112
- type: 曼哈顿距离斯皮尔曼 value: 76.7415076434559
- task:
type: 双语文本挖掘
dataset:
type: mteb/bucc-bitext-mining
name: MTEB BUCC (de-en)
config: de-en
split: 测试集
revision: d51519689f32196a32af33b075a01d0e7c51e252
metrics:
- type: 准确率 value: 75.49060542797494
- type: F1分数 value: 75.15379262352123
- type: 精确率 value: 74.99391092553932
- type: 召回率 value: 75.49060542797494
- task:
type: 双语文本挖掘
dataset:
type: mteb/bucc-bitext-mining
name: MTEB BUCC (fr-en)
config: fr-en
split: 测试集
revision: d51519689f32196a32af33b075a01d0e7c51e252
metrics:
- type: 准确率 value: 0.4182258419546555
- type: F1分数 value: 0.4182258419546555
- type: 精确率 value: 0.4182258419546555
- type: 召回率 value: 0.4182258419546555
- task:
type: 双语文本挖掘
dataset:
type: mteb/bucc-bitext-mining
name: MTEB BUCC (ru-en)
config: ru-en
split: 测试集
revision: d51519689f32196a32af33b075a01d0e7c51e252
metrics:
- type: 准确率 value: 0.013855213023900243
- type: F1分数 value: 0.0115460108532502
- type: 精确率 value: 0.010391409767925183
- type: 召回率 value: 0.013855213023900243
- task:
type: 双语文本挖掘
dataset:
type: mteb/bucc-bitext-mining
name: MTEB BUCC (zh-en)
config: zh-en
split: 测试集
revision: d51519689f32196a32af33b075a01d0e7c51e252
metrics:
- type: 准确率 value: 0.315955766192733
- type: F1分数 value: 0.315955766192733
- type: 精确率 value: 0.315955766192733
- type: 召回率 value: 0.315955766192733
- task:
type: 分类
dataset:
type: mteb/banking77
name: MTEB Banking77分类
config: 默认
split: 测试集
revision: 44fa15921b4c889113cc5df03dd4901b49161ab7
metrics:
- type: 准确率 value: 81.74025974025973
- type: F1分数 value: 81.66568824876
- task:
type: 聚类
dataset:
type: mteb/biorxiv-clustering-p2p
name: MTEB Biorxiv聚类P2P
config: 默认
split: 测试集
revision: 11d0121201d1f1f280e8cc8f3d98fb9c4d9f9c55
metrics:
- type: V度量 value: 33.59451202614059
- task:
type: 聚类
dataset:
type: mteb/biorxiv-clustering-s2s
name: MTEB Biorxiv聚类S2S
config: 默认
split: 测试集
revision: c0fab014e1bcb8d3a5e31b2088972a1e01547dc1
metrics:
- type: V度量 value: 29.128241446157165
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackAndroid检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 26.715
- type: 前十平均精度 value: 35.007
- type: 前百平均精度 value: 36.352000000000004
- type: 前千平均精度 value: 36.51
- type: 前三平均精度 value: 32.257999999999996
- type: 前五平均精度 value: 33.595000000000006
- type: 首位标准化折损累积增益 value: 33.906
- type: 前十标准化折损累积增益 value: 40.353
- type: 前百标准化折损累积增益 value: 45.562999999999995
- type: 前千标准化折损累积增益 value: 48.454
- type: 前三标准化折损累积增益 value: 36.349
- type: 前五标准化折损累积增益 value: 37.856
- type: 首位精确率 value: 33.906
- type: 前十精确率 value: 7.854
- type: 前百精确率 value: 1.29
- type: 前千精确率 value: 0.188
- type: 前三精确率 value: 17.549
- type: 前五精确率 value: 12.561
- type: 首位召回率 value: 26.715
- type: 前十召回率 value: 49.508
- type: 前百召回率 value: 71.76599999999999
- type: 前千召回率 value: 91.118
- type: 前三召回率 value: 37.356
- type: 前五召回率 value: 41.836
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackEnglish检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 19.663
- type: 前十平均精度 value: 27.086
- type: 前百平均精度 value: 28.066999999999997
- type: 前千平均精度 value: 28.18
- type: 前三平均精度 value: 24.819
- type: 前五平均精度 value: 26.332
- type: 首位标准化折损累积增益 value: 25.732
- type: 前十标准化折损累积增益 value: 31.613999999999997
- type: 前百标准化折损累积增益 value: 35.757
- type: 前千标准化折损累积增益 value: 38.21
- type: 前三标准化折损累积增益 value: 28.332
- type: 前五标准化折损累积增益 value: 30.264000000000003
- type: 首位精确率 value: 25.732
- type: 前十精确率 value: 6.038
- type: 前百精确率 value: 1.034
- type: 前千精确率 value: 0.149
- type: 前三精确率 value: 13.864
- type: 前五精确率 value: 10.241999999999999
- type: 首位召回率 value: 19.663
- type: 前十召回率 value: 39.585
- type: 前百召回率 value: 57.718
- type: 前千召回率 value: 74.26700000000001
- type: 前三召回率 value: 29.845
- type: 前五召回率 value: 35.105
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackGaming检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 30.125
- type: 前十平均精度 value: 39.824
- type: 前百平均精度 value: 40.935
- type: 前千平均精度 value: 41.019
- type: 前三平均精度 value: 37.144
- type: 前五平均精度 value: 38.647999999999996
- type: 首位标准化折损累积增益 value: 34.922
- type: 前十标准化折损累积增益 value: 45.072
- type: 前百标准化折损累积增益 value: 50.046
- type: 前千标准化折损累积增益 value: 51.895
- type: 前三标准化折损累积增益 value: 40.251
- type: 前五标准化折损累积增益 value: 42.581
- type: 首位精确率 value: 34.922
- type: 前十精确率 value: 7.303999999999999
- type: 前百精确率 value: 1.0739999999999998
- type: 前千精确率 value: 0.13
- type: 前三精确率 value: 17.994
- type: 前五精确率 value: 12.475999999999999
- type: 首位召回率 value: 30.125
- type: 前十召回率 value: 57.253
- type: 前百召回率 value: 79.35799999999999
- type: 前千召回率 value: 92.523
- type: 前三召回率 value: 44.088
- type: 前五召回率 value: 49.893
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackGis检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 16.298000000000002
- type: 前十平均精度 value: 21.479
- type: 前百平均精度 value: 22.387
- type: 前千平均精度 value: 22.483
- type: 前三平均精度 value: 19.743
- type: 前五平均精度 value: 20.444000000000003
- type: 首位标准化折损累积增益 value: 17.740000000000002
- type: 前十标准化折损累积增益 value: 24.887
- type: 前百标准化折损累积增益 value: 29.544999999999998
- type: 前千标准化折损累积增益 value: 32.417
- type: 前三标准化折损累积增益 value: 21.274
- type: 前五标准化折损累积增益 value: 22.399
- type: 首位精确率 value: 17.740000000000002
- type: 前十精确率 value: 3.932
- type: 前百精确率 value: 0.666
- type: 前千精确率 value: 0.094
- type: 前三精确率 value: 8.927
- type: 前五精确率 value: 6.056
- type: 首位召回率 value: 16.298000000000002
- type: 前十召回率 value: 34.031
- type: 前百召回率 value: 55.769000000000005
- type: 前千召回率 value: 78.19500000000001
- type: 前三召回率 value: 23.799999999999997
- type: 前五召回率 value: 26.562
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackMathematica检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 10.958
- type: 前十平均精度 value: 16.999
- type: 前百平均精度 value: 17.979
- type: 前千平均精度 value: 18.112000000000002
- type: 前三平均精度 value: 15.010000000000002
- type: 前五平均精度 value: 16.256999999999998
- type: 首位标准化折损累积增益 value: 14.179
- type: 前十标准化折损累积增益 value: 20.985
- type: 前百标准化折损累积增益 value: 26.216
- type: 前千标准化折损累积增益 value: 29.675
- type: 前三标准化折损累积增益 value: 17.28
- type: 前五标准化折损累积增益 value: 19.301
- type: 首位精确率 value: 14.179
- type: 前十精确率 value: 3.968
- type: 前百精确率 value: 0.784
- type: 前千精确率 value: 0.121
- type: 前三精确率 value: 8.541
- type: 前五精确率 value: 6.468
- type: 首位召回率 value: 10.958
- type: 前十召回率 value: 29.903000000000002
- type: 前百召回率 value: 53.413
- type: 前千召回率 value: 78.74799999999999
- type: 前三召回率 value: 19.717000000000002
- type: 前五召回率 value: 24.817
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackPhysics检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 21.217
- type: 前十平均精度 value: 29.677
- type: 前百平均精度 value: 30.928
- type: 前千平均精度 value: 31.063000000000002
- type: 前三平均精度 value: 26.611
- type: 前五平均精度 value: 28.463
- type: 首位标准化折损累积增益 value: 26.083000000000002
- type: 前十标准化折损累积增益 value: 35.217
- type: 前百标准化折损累积增益 value: 40.715
- type: 前千标准化折损累积增益 value: 43.559
- type: 前三标准化折损累积增益 value: 30.080000000000002
- type: 前五标准化折损累积增益 value: 32.701
- type: 首位精确率 value: 26.083000000000002
- type: 前十精确率 value: 6.622
- type: 前百精确率 value: 1.115
- type: 前千精确率 value: 0.156
- type: 前三精确率 value: 14.629
- type: 前五精确率 value: 10.837
- type: 首位召回率 value: 21.217
- type: 前十召回率 value: 47.031
- type: 前百召回率 value: 70.378
- type: 前千召回率 value: 89.704
- type: 前三召回率 value: 32.427
- type: 前五召回率 value: 39.31
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackProgrammers检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 19.274
- type: 前十平均精度 value: 26.398
- type: 前百平均精度 value: 27.711000000000002
- type: 前千平均精度 value: 27.833000000000002
- type: 前三平均精度 value: 24.294
- type: 前五平均精度 value: 25.385
- type: 首位标准化折损累积增益 value: 24.886
- type: 前十标准化折损累积增益 value: 30.909
- type: 前百标准化折损累积增益 value: 36.941
- type: 前千标准化折损累积增益 value: 39.838
- type: 前三标准化折损累积增益 value: 27.455000000000002
- type: 前五标准化折损累积增益 value: 28.828
- type: 首位精确率 value: 24.886
- type: 前十精确率 value: 5.6739999999999995
- type: 前百精确率 value: 1.0290000000000001
- type: 前千精确率 value: 0.146
- type: 前三精确率 value: 13.242
- type: 前五精确率 value: 9.292
- type: 首位召回率 value: 19.274
- type: 前十召回率 value: 39.643
- type: 前百召回率 value: 66.091
- type: 前千召回率 value: 86.547
- type: 前三召回率 value: 29.602
- type: 前五召回率 value: 33.561
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstack检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 18.653666666666666
- type: 前十平均精度 value: 25.606666666666666
- type: 前百平均精度 value: 26.669333333333334
- type: 前千平均精度 value: 26.795833333333334
- type: 前三平均精度 value: 23.43433333333333
- type: 前五平均精度 value: 24.609666666666666
- type: 首位标准化折损累积增益 value: 22.742083333333333
- type: 前十标准化折损累积增益 value: 29.978333333333335
- type: 前百标准化折损累积增益 value: 34.89808333333333
- type: 前千标准化折损累积增益 value: 37.806583333333336
- type: 前三标准化折损累积增益 value: 26.223666666666674
- type: 前五标准化折损累积增益 value: 27.91033333333333
- type: 首位精确率 value: 22.742083333333333
- type: 前十精确率 value: 5.397083333333334
- type: 前百精确率 value: 0.9340000000000002
- type: 前千精确率 value: 0.13691666666666663
- type: 前三精确率 value: 12.331083333333332
- type: 前五精确率 value: 8.805499999999999
- type: 首位召回率 value: 18.653666666666666
- type: 前十召回率 value: 39.22625000000001
- type: 前百召回率 value: 61.31049999999999
- type: 前千召回率 value: 82.19058333333334
- type: 前三召回率 value: 28.517333333333333
- type: 前五召回率 value: 32.9565
- task:
type: 检索
dataset:
type: BeIR/cqadupstack
name: MTEB CQADupstackStats检索
config: 默认
split: 测试集
revision: 2b9f5791698b5be7bc5e10535c8690f20043c3db
metrics:
- type: 首位平均精度 value: 16.07
- type: 前十平均精度 value: 21.509
- type: 前百平均精度 value: 22.335
- type: 前千平均精度 value: 22.437
- type: 前三平均精度 value: 19.717000000000002
- type: 前五平均精度 value: 20.574
- type: 首位标准化折损累积增益
- task:
type: 分类
dataset:
type: mteb/amazon_counterfactual
name: MTEB Amazon反事实分类 (en)
config: en
split: 测试集
revision: 2d8a100785abf0ae21420d2a55b0c56e3e1ea996
metrics:
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文