L
LENS D8000
由 yibinlei 开发
LENS-8000 是一个基于转换器的文本嵌入模型,专注于特征提取和句子相似度任务,在多个分类和检索任务中表现出色。
下载量 848
发布时间 : 12/30/2024
模型介绍
内容详情
替代品
模型简介
LENS-8000 是一个高性能的文本嵌入模型,主要用于文本分类、句子相似度计算和特征提取任务。它在 MTEB 基准测试中的多个数据集上展现了优异的性能。
模型特点
高性能文本分类
在多个文本分类任务中表现出色,如 Amazon 评论分类和情感分析。
强大的句子相似度计算
在句子相似度任务中表现优异,能够准确计算文本之间的语义相似度。
多任务支持
支持多种 NLP 任务,包括分类、检索和特征提取。
模型能力
文本嵌入
特征提取
句子相似度计算
文本分类
信息检索
使用案例
电子商务
产品评论分类
对 Amazon 产品评论进行情感分析和分类。
在 AmazonPolarityClassification 任务中准确率达到 97.07%。
反事实评论检测
识别 Amazon 上的反事实评论。
在 AmazonCounterfactualClassification 任务中准确率达到 93.69%。
信息检索
论点检索
在论点分析任务中检索相关论点。
在 ArguAna 检索任务中主要分数达到 76.019。
许可证:Apache-2.0
标签:
- 文本嵌入
- 特征提取
- 句子相似度
- 转换器
- MTEB
模型索引:
- 名称:Gouzi3618/LENS-8000
结果:-
任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification(英文)
类型:mteb/amazon_counterfactual
配置:en
拆分:测试
修订版本:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:- 类型:准确率
值:93.6865671641791 - 类型:平均精度(AP)
值:74.44778735403261 - 类型:加权平均精度(AP)
值:74.44778735403261 - 类型:F1分数
值:90.57338628851295 - 类型:加权F1分数
值:93.87207694461506 - 类型:主要分数
值:93.6865671641791
- 类型:准确率
-
任务:
类型:分类
数据集:
名称:MTEB AmazonPolarityClassification(默认)
类型:mteb/amazon_polarity
配置:默认
拆分:测试
修订版本:e2d317d38cd51312af73b3d32a06d1a08b442046
指标:- 类型:准确率
值:97.06832499999999 - 类型:平均精度(AP)
值:95.71019538629211 - 类型:加权平均精度(AP)
值:95.71019538629211 - 类型:F1分数
值:97.06781792337515 - 类型:加权F1分数
值:97.06781792337515 - 类型:主要分数
值:97.06832499999999
- 类型:准确率
-
任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification(英文)
类型:mteb/amazon_reviews_multi
配置:en
拆分:测试
修订版本:1399c76144fd37290681b995c656ef9b2e06e26d
指标:- 类型:准确率
值:63.608 - 类型:F1分数
值:62.41274991021244 - 类型:加权F1分数
值:62.41274991021244 - 类型:主要分数
值:63.608
- 类型:准确率
-
任务:
类型:检索
数据集:
名称:MTEB ArguAna(默认)
类型:mteb/arguana
配置:默认
拆分:测试
修订版本:c22ab2a51041ffd869aaddef7af8d8215647e41a
指标:- 类型:主要分数
值:76.019 - 类型:前1位平均精度(MAP@1)
值:55.903000000000006 - 类型:前10位平均精度(MAP@10)
值:69.887 - 类型:前100位平均精度(MAP@100)
值:70.157 - 类型:前1000位平均精度(MAP@1000)
值:70.159 - 类型:前20位平均精度(MAP@20)
值:70.101 - 类型:前3位平均精度(MAP@3)
值:67.378 - 类型:前5位平均精度(MAP@5)
值:69.138 - 类型:前1位平均倒数排名(MRR@1)
值:56.899004267425326 - 类型:前10位平均倒数排名(MRR@10)
值:70.23428503691676 - 类型:前100位平均倒数排名(MRR@100)
值:70.50477756895107 - 类型:前1000位平均倒数排名(MRR@1000)
值:70.5063694836776 - 类型:前20位平均倒数排名(MRR@20)
值:70.44906432331086 - 类型:前3位平均倒数排名(MRR@3)
值:67.73352299668105 - 类型:前5位平均倒数排名(MRR@5)
值:69.46183025130412 - 类型:前1000位标准化平均精度差异1(NAUC_MAP@1000_diff1)
值:28.369738335000932 - 类型:前1000位标准化平均精度最大值(NAUC_MAP@1000_max)
值:-6.46878252914094 - 类型:前1000位标准化平均精度标准差(NAUC_MAP@1000_std)
值:-31.433213242739523 - 类型:前100位标准化平均精度差异1(NAUC_MAP@100_diff1)
值:28.37160281520759 - 类型:前100位标准化平均精度最大值(NAUC_MAP@100_max)
值:-6.463942005621383 - 类型:前100位标准化平均精度标准差(NAUC_MAP@100_std)
值:-31.431652236686336 - 类型:前10位标准化平均精度差异1(NAUC_MAP@10_diff1)
值:28.30518291942587 - 类型:前10位标准化平均精度最大值(NAUC_MAP@10_max)
值:-6.194974102740169 - 类型:前10位标准化平均精度标准差(NAUC_MAP@10_std)
值:-31.325188430370922 - 类型:前1位标准化平均精度差异1(NAUC_MAP@1_diff1)
值:31.608647238057447 - 类型:前1位标准化平均精度最大值(NAUC_MAP@1_max)
值:-9.000938880640247 - 类型:前1位标准化平均精度标准差(NAUC_MAP@1_std)
值:-31.850340580223968 - 类型:前20位标准化平均精度差异1(NAUC_MAP@20_diff1)
值:28.36848638837624 - 类型:前20位标准化平均精度最大值(NAUC_MAP@20_max)
值:-6.412381430978799 - 类型:前20位标准化平均精度标准差(NAUC_MAP@20_std)
值:-31.452685362617505 - 类型:前3位标准化平均精度差异1(NAUC_MAP@3_diff1)
值:27.95089394680187 - 类型:前3位标准化平均精度最大值(NAUC_MAP@3_max)
值:-6.302015702313729 - 类型:前3位标准化平均精度标准差(NAUC_MAP@3_std)
值:-31.507334020085302 - 类型:前5位标准化平均精度差异1(NAUC_MAP@5_diff1)
值:27.982348077574986 - 类型:前5位标准化平均精度最大值(NAUC_MAP@5_max)
值:-6.006566315399395 - 类型:前5位标准化平均精度标准差(NAUC_MAP@5_std)
值:-31.34425541540422 - 类型:前1000位标准化平均倒数排名差异1(NAUC_MRR@1000_diff1)
值:25.227964866245816 - 类型:前1000位标准化平均倒数排名最大值(NAUC_MRR@1000_max)
值:-8.133964659261048 - 类型:前1000位标准化平均倒数排名标准差(NAUC_MRR@1000_std)
值:-31.624647211708368 - 类型:前100位标准化平均倒数排名差异1(NAUC_MRR@100_diff1)
值:25.230047265830933 - 类型:前100位标准化平均倒数排名最大值(NAUC_MRR@100_max)
值:-8.128997368626452 - 类型:前100位标准化平均倒数排名标准差(NAUC_MRR@100_std)
值:-31.623068694211064 - 类型:前10位标准化平均倒数排名差异1(NAUC_MRR@10_diff1)
值:25.204936229955173 - 类型:前10位标准化平均倒数排名最大值(NAUC_MRR@10_max)
值:-7.835563207660743 - 类型:前10位标准化平均倒数排名标准差(NAUC_MRR@10_std)
值:-31.513346742425636 - 类型:前1位标准化平均倒数排名差异1(NAUC_MRR@1_diff1)
值:28.89704784792216 - 类型:前1位标准化平均倒数排名最大值(NAUC_MRR@1_max)
值:-9.311272900405159 - 类型:前1位标准化平均倒数排名标准差(NAUC_MRR@1_std)
值:-32.309921279147936 - 类型:前20位标准化平均倒数排名差异1(NAUC_MRR@20_diff1)
值:25.234339492194795 - 类型:前20位标准化平均倒数排名最大值(NAUC_MRR@20_max)
值:-8.07335487193087 - 类型:前20位标准化平均倒数排名标准差(NAUC_MRR@20_std)
值:-31.643711223846516 - 类型:前3位标准化平均倒数排名差异1(NAUC_MRR@3_diff1)
值:24.876431359680033 - 类型:前3位标准化平均倒数排名最大值(NAUC_MRR@3_max)
值:-8.195519132024183 - 类型:前3位标准化平均倒数排名标准差(NAUC_MRR@3_std)
值:-32.11957727976911 - 类型:前5位标准化平均倒数排名差异1(NAUC_MRR@5_diff1)
值:24.88764812242424 - 类型:前5位标准化平均倒数排名最大值(NAUC_MRR@5_max)
值:-7.7576769931519465 - 类型:前5位标准化平均倒数排名标准差(NAUC_MRR@5_std)
值:-31.564378631881564 - 类型:前1000位标准化归一化折损累积增益差异1(NAUC_NDCG@1000_diff1)
值:28.09257580244486 - 类型:前1000位标准化归一化折损累积增益最大值(NAUC_NDCG@1000_max)
值:-5.74562709568006 - 类型:前1000位标准化归一化折损累积增益标准差(NAUC_NDCG@1000_std)
值:-30.918202197214672 - 类型:前100位标准化归一化折损累积增益差异1(NAUC_NDCG@100_diff1)
值:28.134375117688613 - 类型:前100位标准化归一化折损累积增益最大值(NAUC_NDCG@100_max)
值:-5.622192790763758 - 类型:前100位标准化归一化折损累积增益标准差(NAUC_NDCG@100_std)
值:-30.85960292081723 - 类型:前10位标准化归一化折损累积增益差异1(NAUC_NDCG@10_diff1)
值:27.87869834059295 - 类型:前10位标准化归一化折损累积增益最大值(NAUC_NDCG@10_max)
值:-4.2662724404197725 - 类型:前10位标准化归一化折损累积增益标准差(NAUC_NDCG@10_std)
值:-30.429941458615485 - 类型:前1位标准化归一化折损累积增益差异1(NAUC_NDCG@1_diff1)
值:31.608647238057447 - 类型:前1位标准化归一化折损累积增益最大值(NAUC_NDCG@1_max)
值:-9.000938880640247 - 类型:前1位标准化归一化折损累积增益标准差(NAUC_NDCG@1_std)
值:-31.850340580223968 - 类型:前20位标准化归一化折损累积增益差异1(NAUC_NDCG@20_diff1)
值:28.114701479308486 - 类型:前20位标准化归一化折损累积增益最大值(NAUC_NDCG@20_max)
值:-5.185807260199579 - 类型:前20位标准化归一化折损累积增益标准差(NAUC_NDCG@20_std)
值:-30.881592179360815 - 类型:前3位标准化归一化折损累积增益差异1(NAUC_NDCG@3_diff1)
值:27.090519410510677 - 类型:前3位标准化归一化折损累积增益最大值(NAUC_NDCG@3_max)
值:-4.699103690447523 - 类型:前3位标准化归一化折损累积增益标准差(NAUC_NDCG@3_std)
值:-31.00974723525509 - 类型:前5位标准化归一化折损累积增益差异1(NAUC_NDCG@5_diff1)
值:27.06577902395562 - 类型:前5位标准化归一化折损累积增益最大值(NAUC_NDCG@5_max)
值:-3.896494379869019 - 类型:前5位标准化归一化折损累积增益标准差(NAUC_NDCG@5_std)
值:-30.595264634140477 - 类型:前1000位标准化精确率差异1(NAUC_Precision@1000_diff1)
值:13.625066205876864 - 类型:前1000位标准化精确率最大值(NAUC_Precision@1000_max)
值:31.077851886953717 - 类型:前1000位标准化精确率标准差(NAUC_Precision@1000_std)
值:47.82408874251543 - 类型:前100位标准化精确率差异1(NAUC_Precision@100_diff1)
值:28.334166321212894 - 类型:前100位标准化精确率最大值(NAUC_Precision@100_max)
值:45.958982731935635 - 类型:前100位标准化精确率标准差(NAUC_Precision@100_std)
值:33.156399537789966 - 类型:前10位标准化精确率差异1(NAUC_Precision@10_diff1)
值:24.44965698632213 - 类型:前10位标准化精确率最大值(NAUC_Precision@10_max)
值:22.187375935245363 - 类型:前10位标准化精确率标准差(NAUC_Precision@10_std)
值:-17.084349043862684 - 类型:前1位标准化精确率差异1(NAUC_Precision@1_diff1)
值:31.608647238057447 - 类型:前1位标准化精确率最大值(NAUC_Precision@1_max)
值:-9.000938880640247 - 类型:前1位标准化精确率标准差(NAUC_Precision@1_std)
值:-31.850340580223968 - 类型:前20位标准化精确率差异1(NAUC_Precision@20_diff1)
值:27.146201764531284 - 类型:前20位标准化精确率最大值(NAUC_Precision@20_max)
值:26.77044396290566 - 类型:前20位标准化精确率标准差(NAUC_Precision@20_std)
值:-12.639636692077305 - 类型:前3位标准化精确率差异1(NAUC_Precision@3_diff1)
值:23.662213602558584 - 类型:前3位标准化精确率最大值(NAUC_Precision@3_max)
值:2.466959457953989 - 类型:前3位标准化精确率标准差(NAUC_Precision@3_std)
值:-28.691552875980207 - 类型:前5位标准化精确率差异1(NAUC_Precision@5_diff1)
值:21.42559683194896 - 类型:前5位标准化精确率最大值(NAUC_Precision@5_max)
值:10.877697931273545 - 类型:前5位标准化精确率标准差(NAUC_Precision@5_std)
值:-25.1444110698694 - 类型:前1000位标准化召回率差异1(NAUC_Recall@1000_diff1)
值:13.625066205870539 - 类型:前1000位标准化召回率最大值(NAUC_Recall@1000_max)
值:31.077851886952303 - 类型:前1000位标准化召回率标准差(NAUC_Recall@1000_std)
值:47.82408874251562 - 类型:前100位标准化召回率差异1(NAUC_Recall@100_diff1)
值:28.33416632120962 - 类型:前100位标准化召回率最大值(NAUC_Recall@100_max)
值:45.958982731932394 - 类型:前100位标准化召回率标准差(NAUC_Recall@100_std)
值:33.15639953779121 - 类型:前10位标准化召回率差异1(NAUC_Recall@10_diff1)
值:24.449656986321795 - 类型:前10位标准化召回率最大值(NAUC_Recall@10_max)
值:22.18737593524522 - 类型:前10位标准化召回率标准差(NAUC_Recall@10_std)
值:-17.084349043862865 - 类型:前1位标准化召回率差异1(NAUC_Recall@1_diff1)
值:31.608647238057447 - 类型:前1位标准化召回率最大值(NAUC_Recall@1_max)
值:-9.000938880640247 - 类型:前1位标准化召回率标准差(NAUC_Recall@1_std)
值:-31.850340580223968 - 类型:前20位标准化召回率差异1(NAUC_Recall@20_diff1)
值:27.146201764531586 - 类型:前20位标准化召回率最大值(NAUC_Recall@20_max)
值:26.770443962904633 - 类型:前20位标准化召回率标准差(NAUC_Recall@20_std)
值:-12.639636692076802 - 类型:前3位标准化召回率差异1(NAUC_Recall@3_diff1)
值:23.66221360255874 - 类型:前3位标准化召回率最大值(NAUC_Recall@3_max)
值:2.466959457954044 - 类型:前3位标准化召回率标准差(NAUC_Recall@3_std)
值:-28.691552875980115 - 类型:前5位标准化召回率差异1(NAUC_Recall@5_diff1)
值:21.425596831948823 - 类型:前5位标准化召回率最大值(NAUC_Recall@5_max)
值:10.87769793127329 - 类型:前5位标准化召回率标准差(NAUC_Recall@5_std)
值:-25.144411069869477 - 类型:前1位归一化折损累积增益(NDCG@1)
值:55.903000000000006 - 类型:前10位归一化折损累积增益(NDCG@10)
值:76.019 - 类型:前100位归一化折损累积增益(NDCG@100)
值:77.102 - 类型:前1000位归一化折损累积增益(NDCG@1000)
值:77.132 - 类型:前20位归一化折损累积增益(NDCG@20)
值:76.77199999999999 - 类型:前3位归一化折损累积增益(NDCG@3)
值:71.032 - 类型:前5位归一化折损累积增益(NDCG@5)
值:74.22999999999999 - 类型:前1位精确率(Precision@1)
值:55.903000000000006 - 类型:前10位精确率(Precision@10)
值:9.488000000000001
- 类型:主要分数
-
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文