模型介绍
内容详情
替代品
模型简介
该模型是基于intfloat/multilingual-e5-large-instruct的多语言文本嵌入模型,支持多种语言的文本分类、检索和聚类任务。
模型特点
多语言支持
支持超过100种语言的文本嵌入和分类任务
高性能
在多种文本分类和检索任务上表现优异
指令优化
针对指令任务进行了优化,适合需要精确控制的文本处理场景
模型能力
文本嵌入
文本分类
文本检索
文本聚类
双文本挖掘
语义相似度计算
使用案例
电子商务
产品评论分类
对多语言产品评论进行情感分析和分类
在MTEB AmazonPolarityClassification任务中准确率达到96.29%
信息检索
文档检索
从大规模文档库中检索相关信息
在MTEB ArguAna检索任务中map@100达到49.88
文本分析
文本聚类
对相似文本进行自动聚类
在MTEB ArxivClusteringP2P任务中v_measure达到46.40
标签:
- mteb
- sentence-transformers
- transformers
- llama-cpp 语言:
- 多语言
- 南非荷兰语
- 阿姆哈拉语
- 阿拉伯语
- 阿萨姆语
- 阿塞拜疆语
- 白俄罗斯语
- 保加利亚语
- 孟加拉语
- 布列塔尼语
- 波斯尼亚语
- 加泰罗尼亚语
- 捷克语
- 威尔士语
- 丹麦语
- 德语
- 希腊语
- 英语
- 世界语
- 西班牙语
- 爱沙尼亚语
- 巴斯克语
- 波斯语
- 芬兰语
- 法语
- 弗里西亚语
- 爱尔兰语
- 苏格兰盖尔语
- 加利西亚语
- 古吉拉特语
- 豪萨语
- 希伯来语
- 印地语
- 克罗地亚语
- 匈牙利语
- 亚美尼亚语
- 印度尼西亚语
- 冰岛语
- 意大利语
- 日语
- 爪哇语
- 格鲁吉亚语
- 哈萨克语
- 高棉语
- 卡纳达语
- 韩语
- 库尔德语
- 吉尔吉斯语
- 拉丁语
- 老挝语
- 立陶宛语
- 拉脱维亚语
- 马达加斯加语
- 马其顿语
- 马拉雅拉姆语
- 蒙古语
- 马拉地语
- 马来语
- 缅甸语
- 尼泊尔语
- 荷兰语
- 挪威语
- 奥罗莫语
- 奥里亚语
- 旁遮普语
- 波兰语
- 普什图语
- 葡萄牙语
- 罗马尼亚语
- 俄语
- 梵语
- 信德语
- 僧伽罗语
- 斯洛伐克语
- 斯洛文尼亚语
- 索马里语
- 阿尔巴尼亚语
- 塞尔维亚语
- 巽他语
- 瑞典语
- 斯瓦希里语
- 泰米尔语
- 泰卢固语
- 泰语
- 他加禄语
- 土耳其语
- 维吾尔语
- 乌克兰语
- 乌尔都语
- 乌兹别克语
- 越南语
- 科萨语
- 意第绪语
- 中文 许可证:mit 基础模型:intfloat/multilingual-e5-large-instruct 模型索引:
- 名称:multilingual-e5-large-instruct
结果:
- 任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (en)
类型:mteb/amazon_counterfactual
配置:en
分割:测试
修订:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:
- 类型:准确率 值:76.23880597014924
- 类型:平均精度 值:39.07351965022687
- 类型:f1 值:70.04836733862683
- 任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (de)
类型:mteb/amazon_counterfactual
配置:de
分割:测试
修订:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:
- 类型:准确率 值:66.71306209850107
- 类型:平均精度 值:79.01499914759529
- 类型:f1 值:64.81951817560703
- 任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (en-ext)
类型:mteb/amazon_counterfactual
配置:en-ext
分割:测试
修订:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:
- 类型:准确率 值:73.85307346326837
- 类型:平均精度 值:22.447519885878737
- 类型:f1 值:61.0162730745633
- 任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (ja)
类型:mteb/amazon_counterfactual
配置:ja
分割:测试
修订:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:
- 类型:准确率 值:76.04925053533191
- 类型:平均精度 值:23.44983217128922
- 类型:f1 值:62.5723230907759
- 任务:
类型:分类
数据集:
名称:MTEB AmazonPolarityClassification
类型:mteb/amazon_polarity
配置:默认
分割:测试
修订:e2d317d38cd51312af73b3d32a06d1a08b442046
指标:
- 类型:准确率 值:96.28742500000001
- 类型:平均精度 值:94.8449918887462
- 类型:f1 值:96.28680923610432
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (en)
类型:mteb/amazon_reviews_multi
配置:en
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:56.716
- 类型:f1 值:55.76510398266401
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (de)
类型:mteb/amazon_reviews_multi
配置:de
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:52.99999999999999
- 类型:f1 值:52.00829994765178
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (es)
类型:mteb/amazon_reviews_multi
配置:es
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:48.806000000000004
- 类型:f1 值:48.082345914983634
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (fr)
类型:mteb/amazon_reviews_multi
配置:fr
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:48.507999999999996
- 类型:f1 值:47.68752844642045
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (ja)
类型:mteb/amazon_reviews_multi
配置:ja
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:47.709999999999994
- 类型:f1 值:47.05870376637181
- 任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (zh)
类型:mteb/amazon_reviews_multi
配置:zh
分割:测试
修订:1399c76144fd37290681b995c656ef9b2e06e26d
指标:
- 类型:准确率 值:44.662000000000006
- 类型:f1 值:43.42371965372771
- 任务:
类型:检索
数据集:
名称:MTEB ArguAna
类型:arguana
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:31.721
- 类型:map_at_10 值:49.221
- 类型:map_at_100 值:49.884
- 类型:map_at_1000 值:49.888
- 类型:map_at_3 值:44.31
- 类型:map_at_5 值:47.276
- 类型:mrr_at_1 值:32.432
- 类型:mrr_at_10 值:49.5
- 类型:mrr_at_100 值:50.163000000000004
- 类型:mrr_at_1000 值:50.166
- 类型:mrr_at_3 值:44.618
- 类型:mrr_at_5 值:47.541
- 类型:ndcg_at_1 值:31.721
- 类型:ndcg_at_10 值:58.384
- 类型:ndcg_at_100 值:61.111000000000004
- 类型:ndcg_at_1000 值:61.187999999999995
- 类型:ndcg_at_3 值:48.386
- 类型:ndcg_at_5 值:53.708999999999996
- 类型:precision_at_1 值:31.721
- 类型:precision_at_10 值:8.741
- 类型:precision_at_100 值:0.991
- 类型:precision_at_1000 值:0.1
- 类型:precision_at_3 值:20.057
- 类型:precision_at_5 值:14.609
- 类型:recall_at_1 值:31.721
- 类型:recall_at_10 值:87.411
- 类型:recall_at_100 值:99.075
- 类型:recall_at_1000 值:99.644
- 类型:recall_at_3 值:60.171
- 类型:recall_at_5 值:73.044
- 任务:
类型:聚类
数据集:
名称:MTEB ArxivClusteringP2P
类型:mteb/arxiv-clustering-p2p
配置:默认
分割:测试
修订:a122ad7f3f0291bf49cc6f4d32aa80929df69d5d
指标:
- 类型:v_measure 值:46.40419580759799
- 任务:
类型:聚类
数据集:
名称:MTEB ArxivClusteringS2S
类型:mteb/arxiv-clustering-s2s
配置:默认
分割:测试
修订:f910caf1a6075f7329cdf8c1a6135696f37dbd53
指标:
- 类型:v_measure 值:40.48593255007969
- 任务:
类型:重新排序
数据集:
名称:MTEB AskUbuntuDupQuestions
类型:mteb/askubuntudupquestions-reranking
配置:默认
分割:测试
修订:2000358ca161889fa9c082cb41daa8dcfb161a54
指标:
- 类型:map 值:63.889179122289995
- 类型:mrr 值:77.61146286769556
- 任务:
类型:STS
数据集:
名称:MTEB BIOSSES
类型:mteb/biosses-sts
配置:默认
分割:测试
修订:d3fb88f8f02e40887cd149695127462bbcf29b4a
指标:
- 类型:cos_sim_pearson 值:88.15075203727929
- 类型:cos_sim_spearman 值:86.9622224570873
- 类型:euclidean_pearson 值:86.70473853624121
- 类型:euclidean_spearman 值:86.9622224570873
- 类型:manhattan_pearson 值:86.21089380980065
- 类型:manhattan_spearman 值:86.75318154937008
- 任务:
类型:双文本挖掘
数据集:
名称:MTEB BUCC (de-en)
类型:mteb/bucc-bitext-mining
配置:de-en
分割:测试
修订:d51519689f32196a32af33b075a01d0e7c51e252
指标:
- 类型:准确率 值:99.65553235908142
- 类型:f1 值:99.60681976339595
- 类型:精确率 值:99.58246346555325
- 类型:召回率 值:99.65553235908142
- 任务:
类型:双文本挖掘
数据集:
名称:MTEB BUCC (fr-en)
类型:mteb/bucc-bitext-mining
配置:fr-en
分割:测试
修订:d51519689f32196a32af33b075a01d0e7c51e252
指标:
- 类型:准确率 值:99.26260180497468
- 类型:f1 值:99.14520507740848
- 类型:精确率 值:99.08650671362535
- 类型:召回率 值:99.26260180497468
- 任务:
类型:双文本挖掘
数据集:
名称:MTEB BUCC (ru-en)
类型:mteb/bucc-bitext-mining
配置:ru-en
分割:测试
修订:d51519689f32196a32af33b075a01d0e7c51e252
指标:
- 类型:准确率 值:98.07412538967787
- 类型:f1 值:97.86629719431936
- 类型:精确率 值:97.76238309664012
- 类型:召回率 值:98.07412538967787
- 任务:
类型:双文本挖掘
数据集:
名称:MTEB BUCC (zh-en)
类型:mteb/bucc-bitext-mining
配置:zh-en
分割:测试
修订:d51519689f32196a32af33b075a01d0e7c51e252
指标:
- 类型:准确率 值:99.42074776197998
- 类型:f1 值:99.38564156573635
- 类型:精确率 值:99.36808846761454
- 类型:召回率 值:99.42074776197998
- 任务:
类型:分类
数据集:
名称:MTEB Banking77Classification
类型:mteb/banking77
配置:默认
分割:测试
修订:0fd18e25b25c072e09e0d92ab615fda904d66300
指标:
- 类型:准确率 值:85.73376623376623
- 类型:f1 值:85.68480707214599
- 任务:
类型:聚类
数据集:
名称:MTEB BiorxivClusteringP2P
类型:mteb/biorxiv-clustering-p2p
配置:默认
分割:测试
修订:65b79d1d13f80053f67aca9498d9402c2d9f1f40
指标:
- 类型:v_measure 值:40.935218072113855
- 任务:
类型:聚类
数据集:
名称:MTEB BiorxivClusteringS2S
类型:mteb/biorxiv-clustering-s2s
配置:默认
分割:测试
修订:258694dd0231531bc1fd9de6ceb52a0853c6d908
指标:
- 类型:v_measure 值:36.276389017675264
- 任务:
类型:检索
数据集:
名称:MTEB CQADupstackRetrieval
类型:BeIR/cqadupstack
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:27.764166666666668
- 类型:map_at_10 值:37.298166666666674
- 类型:map_at_100 值:38.530166666666666
- 类型:map_at_1000 值:38.64416666666667
- 类型:map_at_3 值:34.484833333333334
- 类型:map_at_5 值:36.0385
- 类型:mrr_at_1 值:32.93558333333333
- 类型:mrr_at_10 值:41.589749999999995
- 类型:mrr_at_100 值:42.425333333333334
- 类型:mrr_at_1000 值:42.476333333333336
- 类型:mrr_at_3 值:39.26825
- 类型:mrr_at_5 值:40.567083333333336
- 类型:ndcg_at_1 值:32.93558333333333
- 类型:ndcg_at_10 值:42.706583333333334
- 类型:ndcg_at_100 值:47.82483333333333
- 类型:ndcg_at_1000 值:49.95733333333334
- 类型:ndcg_at_3 值:38.064750000000004
- 类型:ndcg_at_5 值:40.18158333333333
- 类型:precision_at_1 值:32.93558333333333
- 类型:precision_at_10 值:7.459833333333334
- 类型:precision_at_100 值:1.1830833333333335
- 类型:precision_at_1000 值:0.15608333333333332
- 类型:precision_at_3 值:17.5235
- 类型:precision_at_5 值:12.349833333333333
- 类型:recall_at_1 值:27.764166666666668
- 类型:recall_at_10 值:54.31775
- 类型:recall_at_100 值:76.74350000000001
- 类型:recall_at_1000 值:91.45208333333332
- 类型:recall_at_3 值:41.23425
- 类型:recall_at_5 值:46.73983333333334
- 任务:
类型:检索
数据集:
名称:MTEB ClimateFEVER
类型:climate-fever
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:12.969
- 类型:map_at_10 值:21.584999999999997
- 类型:map_at_100 值:23.3
- 类型:map_at_1000 值:23.5
- 类型:map_at_3 值:18.218999999999998
- 类型:map_at_5 值:19.983
- 类型:mrr_at_1 值:29.316
- 类型:mrr_at_10 值:40.033
- 类型:mrr_at_100 值:40.96
- 类型:mrr_at_1000 值:41.001
- 类型:mrr_at_3 值:37.123
- 类型:mrr_at_5 值:38.757999999999996
- 类型:ndcg_at_1 值:29.316
- 类型:ndcg_at_10 值:29.858
- 类型:ndcg_at_100 值:36.756
- 类型:ndcg_at_1000 值:40.245999999999995
- 类型:ndcg_at_3 值:24.822
- 类型:ndcg_at_5 值:26.565
- 类型:precision_at_1 值:29.316
- 类型:precision_at_10 值:9.186
- 类型:precision_at_100 值:1.6549999999999998
- 类型:precision_at_1000 值:0.22999999999999998
- 类型:precision_at_3 值:18.436
- 类型:precision_at_5 值:13.876
- 类型:recall_at_1 值:12.969
- 类型:recall_at_10 值:35.142
- 类型:recall_at_100 值:59.143
- 类型:recall_at_1000 值:78.594
- 类型:recall_at_3 值:22.604
- 类型:recall_at_5 值:27.883000000000003
- 任务:
类型:检索
数据集:
名称:MTEB DBPedia
类型:dbpedia-entity
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:8.527999999999999
- 类型:map_at_10 值:17.974999999999998
- 类型:map_at_100 值:25.665
- 类型:map_at_1000 值:27.406000000000002
- 类型:map_at_3 值:13.017999999999999
- 类型:map_at_5 值:15.137
- 类型:mrr_at_1 值:62.5
- 类型:mrr_at_10 值:71.891
- 类型:mrr_at_100 值:72.294
- 类型:mrr_at_1000 值:72.296
- 类型:mrr_at_3 值:69.958
- 类型:mrr_at_5 值:71.121
- 类型:ndcg_at_1 值:50.875
- 类型:ndcg_at_10 值:38.36
- 类型:ndcg_at_100 值:44.235
- 类型:ndcg_at_1000 值:52.154
- 类型:ndcg_at_3 值:43.008
- 类型:ndcg_at_5 值:40.083999999999996
- 类型:precision_at_1 值:62.5
- 类型:precision_at_10 值:30
- 类型:precision_at_100 值:10.038
- 类型:precision_at_1000 值:2.0869999999999997
- 类型:precision_at_3 值:46.833000000000006
- 类型:precision_at_5 值:38.800000000000004
- 类型:recall_at_1 值:8.527999999999999
- 类型:recall_at_10 值:23.828
- 类型:recall_at_100 值:52.322
- 类型:recall_at_1000 值:77.143
- 类型:recall_at_3 值:14.136000000000001
- 类型:recall_at_5 值:17.761
- 任务:
类型:分类
数据集:
名称:MTEB EmotionClassification
类型:mteb/emotion
配置:默认
分割:测试
修订:4f58c6b202a23cf9a4da393831edf4f9183cad37
指标:
- 类型:准确率 值:51.51
- 类型:f1 值:47.632159862049896
- 任务:
类型:检索
数据集:
名称:MTEB FEVER
类型:fever
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:60.734
- 类型:map_at_10 值:72.442
- 类型:map_at_100 值:72.735
- 类型:map_at_1000 值:72.75
- 类型:map_at_3 值:70.41199999999999
- 类型:map_at_5 值:71.80499999999999
- 类型:mrr_at_1 值:65.212
- 类型:mrr_at_10 值:76.613
- 类型:mrr_at_100 值:76.79899999999999
- 类型:mrr_at_1000 值:76.801
- 类型:mrr_at_3 值:74.8
- 类型:mrr_at_5 值:76.12400000000001
- 类型:ndcg_at_1 值:65.212
- 类型:ndcg_at_10 值:77.988
- 类型:ndcg_at_100 值:79.167
- 类型:ndcg_at_1000 值:79.452
- 类型:ndcg_at_3 值:74.362
- 类型:ndcg_at_5 值:76.666
- 类型:precision_at_1 值:65.212
- 类型:precision_at_10 值:10.003
- 类型:precision_at_100 值:1.077
- 类型:precision_at_1000 值:0.11199999999999999
- 类型:precision_at_3 值:29.518
- 类型:precision_at_5 值:19.016
- 类型:recall_at_1 值:60.734
- 类型:recall_at_10 值:90.824
- 类型:recall_at_100 值:95.71600000000001
- 类型:recall_at_1000 值:97.577
- 类型:recall_at_3 值:81.243
- 类型:recall_at_5 值:86.90299999999999
- 任务:
类型:检索
数据集:
名称:MTEB FiQA2018
类型:fiqa
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:23.845
- 类型:map_at_10 值:39.281
- 类型:map_at_100 值:41.422
- 类型:map_at_1000 值:41.593
- 类型:map_at_3 值:34.467
- 类型:map_at_5 值:37.017
- 类型:mrr_at_1 值:47.531
- 类型:mrr_at_10 值:56.204
- 类型:mrr_at_100 值:56.928999999999995
- 类型:mrr_at_1000 值:56.962999999999994
- 类型:mrr_at_3 值:54.115
- 类型:mrr_at_5 值:55.373000000000005
- 类型:ndcg_at_1 值:47.531
- 类型:ndcg_at_10 值:47.711999999999996
- 类型:ndcg_at_100 值:54.510999999999996
- 类型:ndcg_at_1000 值:57.103
- 类型:ndcg_at_3 值:44.145
- 类型:ndcg_at_5 值:45.032
- 类型:precision_at_1 值:47.531
- 类型:precision_at_10 值:13.194
- 类型:precision_at_100 值:2.045
- 类型:precision_at_1000 值:0.249
- 类型:precision_at_3 值:29.424
- 类型:precision_at_5 值:21.451
- 类型:recall_at_1 值:23.845
- 类型:recall_at_10 值:54.967
- 类型:recall_at_100 值:79.11399999999999
- 类型:recall_at_1000 值:94.56700000000001
- 类型:recall_at_3 值:40.256
- 类型:recall_at_5 值:46.215
- 任务:
类型:检索
数据集:
名称:MTEB HotpotQA
类型:hotpotqa
配置:默认
分割:测试
修订:无
指标:
- 类型:map_at_1 值:37.819
- 类型:map_at_10 值:60.889
- 类型:map_at_100 值:61.717999999999996
- 类型:map_at_1000 值:61.778
- 类型:map_at_3 值:57.254000000000005
- 类型:map_at_5 值:59.541
- 类型:mrr_at_1 值:75.638
- 类型:mrr_at_10 值:82.173
- 类型:mrr_at_100 值:82.362
- 类型:mrr_at_1000 值:82.37
- 类型:mrr_at_3 值:81.089
- 类型:mrr_at_5 值:81.827
- 类型:ndcg_at_1 值:75.638
- 类型:ndcg_at_10 值:69.317
- 类型:ndcg_at_100 值:72.221
- 类型:ndcg_at_1000 值:73.382
- 类型:ndcg_at_3 值:64.14
- 类型:ndcg_at_5 值:67.07600000000001
- 类型:precision_at_1 值:75.638
- 类型:precision_at_10 值:14.704999999999998
- 类型:precision_at_100 值:1.698
- 类型:precision_at_1000 值:0.185
- 类型:precision_at_3 值:41.394999999999996
- 类型:precision_at_5 值:27.162999999999997
- 类型:recall_at_1 值:37.819
- 类型:recall_at_10 值:73.52499999999999
- 类型:recall_at_100 值:84.875
- 类型:recall_at_1000 值:92.559
- 类型:recall_at_3 值:62.092999999999996
- 类型:recall_at_5 值:67.907
- 任务:
类型:分类
数据集:
名称:MTEB ImdbClassification
类型:mteb/imdb
配置:默认
分割:测试
修订:3d86128a09e091d6018b6d26cad27f2739fc2db7
指标:
- 类型:准确率 值:94.60079999999999
- 类型:平均精度 值:92.67396345347356
- 类型:f1 值:94.5988098167121
- 任务:
类型:检索
数据集:
名称:MTEB MSMARCO
类型:msmarco
配置:默认
分割:开发
修订:无
指标:
- 类型:map_at_1 值:21.285
- 类型:map_at_10 值:33.436
- 类型:map_at_100 值:34.63
- 类型:map_at_1000 值:34.681
- 类型:map_at_3 值:29.412
- 类型:map_at_
- 任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (en)
类型:mteb/amazon_counterfactual
配置:en
分割:测试
修订:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:
Phi 2 GGUF
其他
Phi-2是微软开发的一个小型但强大的语言模型,具有27亿参数,专注于高效推理和高质量文本生成。
大型语言模型
支持多种语言
P
TheBloke
41.5M
205
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型
英语
R
FacebookAI
19.4M
212
Distilbert Base Uncased
Apache-2.0
DistilBERT是BERT基础模型的蒸馏版本,在保持相近性能的同时更轻量高效,适用于序列分类、标记分类等自然语言处理任务。
大型语言模型
英语
D
distilbert
11.1M
669
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型
英语
L
modularai
9.7M
4
Xlm Roberta Base
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型
支持多种语言
X
FacebookAI
9.6M
664
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型
英语
R
FacebookAI
9.3M
488
Opt 125m
其他
OPT是由Meta AI发布的开放预训练Transformer语言模型套件,参数量从1.25亿到1750亿,旨在对标GPT-3系列性能,同时促进大规模语言模型的开放研究。
大型语言模型
英语
O
facebook
6.3M
198
Llama 3.1 8B Instruct
Llama 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B参数规模,支持8种语言和代码生成,优化了多语言对话场景。
大型语言模型
Transformers

支持多种语言
L
meta-llama
5.7M
3,898
T5 Base
Apache-2.0
T5基础版是由Google开发的文本到文本转换Transformer模型,参数规模2.2亿,支持多语言NLP任务。
大型语言模型
支持多种语言
T
google-t5
5.4M
702
Xlm Roberta Large
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型
支持多种语言
X
FacebookAI
5.3M
431
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文