L
LENS D4000
由 yibinlei 开发
LENS-4000 是一个基于变换器的文本嵌入模型,专注于特征提取和句子相似度计算,在多个文本分类任务中表现出色。
下载量 19
发布时间 : 12/30/2024
模型介绍
内容详情
替代品
模型简介
该模型主要用于文本嵌入和特征提取,能够高效计算句子相似度,适用于多种自然语言处理任务。
模型特点
高性能文本分类
在多个文本分类任务中表现优异,如亚马逊评论分类准确率达到97.05%。
句子相似度计算
能够高效计算句子间的相似度,适用于信息检索和匹配任务。
多任务支持
支持多种自然语言处理任务,包括分类、检索等。
模型能力
文本嵌入
特征提取
句子相似度计算
文本分类
信息检索
使用案例
电子商务
亚马逊评论分类
对亚马逊商品评论进行情感分类(正面/负面)。
准确率97.05%,F1分数97.05%
反事实评论检测
识别亚马逊平台上的反事实评论。
准确率93.61%,F1分数93.76%
信息检索
论点检索
在辩论数据集中检索相关论点。
NDCG@10得分77.32
许可证:Apache-2.0
标签:
- 文本嵌入
- 特征提取
- 句子相似度
- 变换器
- MTEB
模型索引:
- 名称:Gouzi3618/LENS-4000
结果:-
任务:
类型:分类
数据集:
名称:MTEB AmazonCounterfactualClassification (en)
类型:mteb/amazon_counterfactual
配置:en
拆分:测试
修订版本:e8379541af4e31359cca9fbcf4b00f2671dba205
指标:- 类型:准确率
值:93.61194029850746 - 类型:平均精度(AP)
值:73.89383804438975 - 类型:加权平均精度
值:73.89383804438975 - 类型:F1分数
值:90.31690759629414 - 类型:加权F1分数
值:93.75647989786705 - 类型:主要得分
值:93.61194029850746
- 类型:准确率
-
任务:
类型:分类
数据集:
名称:MTEB AmazonPolarityClassification (默认)
类型:mteb/amazon_polarity
配置:默认
拆分:测试
修订版本:e2d317d38cd51312af73b3d32a06d1a08b442046
指标:- 类型:准确率
值:97.05455 - 类型:平均精度(AP)
值:95.53082050876944 - 类型:加权平均精度
值:95.53082050876944 - 类型:F1分数
值:97.05405422635297 - 类型:加权F1分数
值:97.05405422635297 - 类型:主要得分
值:97.05455
- 类型:准确率
-
任务:
类型:分类
数据集:
名称:MTEB AmazonReviewsClassification (en)
类型:mteb/amazon_reviews_multi
配置:en
拆分:测试
修订版本:1399c76144fd37290681b995c656ef9b2e06e26d
指标:- 类型:准确率
值:62.834 - 类型:F1分数
值:61.45864309016823 - 类型:加权F1分数
值:61.45864309016823 - 类型:主要得分
值:62.834
- 类型:准确率
-
任务:
类型:检索
数据集:
名称:MTEB ArguAna (默认)
类型:mteb/arguana
配置:默认
拆分:测试
修订版本:c22ab2a51041ffd869aaddef7af8d8215647e41a
指标:- 类型:主要得分
值:77.31700000000001 - 类型:第1位平均精度(MAP@1)
值:56.757000000000005 - 类型:第10位平均精度(MAP@10)
值:71.136 - 类型:第100位平均精度(MAP@100)
值:71.339 - 类型:第1000位平均精度(MAP@1000)
值:71.34 - 类型:第20位平均精度(MAP@20)
值:71.314 - 类型:第3位平均精度(MAP@3)
值:68.67 - 类型:第5位平均精度(MAP@5)
值:70.274 - 类型:第1位平均倒数排名(MRR@1)
值:57.7524893314367 - 类型:第10位平均倒数排名(MRR@10)
值:71.48944997629222 - 类型:第100位平均倒数排名(MRR@100)
值:71.69295763275832 - 类型:第1000位平均倒数排名(MRR@1000)
值:71.69337848338161 - 类型:第20位平均倒数排名(MRR@20)
值:71.66813464342809 - 类型:第3位平均倒数排名(MRR@3)
值:69.04931247036524 - 类型:第5位平均倒数排名(MRR@5)
值:70.61403508771947 - 类型:NAUC MAP@1000差异1
值:22.388799480884085 - 类型:NAUC MAP@1000最大值
值:-12.478980783254928 - 类型:NAUC MAP@1000标准差
值:-34.52645054563002 - 类型:NAUC MAP@100差异1
值:22.390230435504822 - 类型:NAUC MAP@100最大值
值:-12.476906954784145 - 类型:NAUC MAP@100标准差
值:-34.52397021747207 - 类型:NAUC MAP@10差异1
值:22.376630933605696 - 类型:NAUC MAP@10最大值
值:-12.263443549324265 - 类型:NAUC MAP@10标准差
值:-34.54600345217659 - 类型:NAUC MAP@1差异1
值:24.736009447964786 - 类型:NAUC MAP@1最大值
值:-15.468802285096888 - 类型:NAUC MAP@1标准差
值:-34.94706450308731 - 类型:NAUC MAP@20差异1
值:22.42616556265818 - 类型:NAUC MAP@20最大值
值:-12.405995637209402 - 类型:NAUC MAP@20标准差
值:-34.51377335859978 - 类型:NAUC MAP@3差异1
值:22.371578696906337 - 类型:NAUC MAP@3最大值
值:-11.688805933888062 - 类型:NAUC MAP@3标准差
值:-34.527333588071734 - 类型:NAUC MAP@5差异1
值:22.336979324422785 - 类型:NAUC MAP@5最大值
值:-11.708158232210106 - 类型:NAUC MAP@5标准差
值:-34.0971263102141 - 类型:NAUC MRR@1000差异1
值:19.213326943604773 - 类型:NAUC MRR@1000最大值
值:-13.159790933260695 - 类型:NAUC MRR@1000标准差
值:-34.37354227933731 - 类型:NAUC MRR@100差异1
值:19.21482127549166 - 类型:NAUC MRR@100最大值
值:-13.157697787479252 - 类型:NAUC MRR@100标准差
值:-34.371056737336566 - 类型:NAUC MRR@10差异1
值:19.229328983348385 - 类型:NAUC MRR@10最大值
值:-12.937512977150767 - 类型:NAUC MRR@10标准差
值:-34.394516401257476 - 类型:NAUC MRR@1差异1
值:21.9227471620602 - 类型:NAUC MRR@1最大值
值:-14.49455136413785 - 类型:NAUC MRR@1标准差
值:-34.40628723085126 - 类型:NAUC MRR@20差异1
值:19.2543334569671 - 类型:NAUC MRR@20最大值
值:-13.085814849140306 - 类型:NAUC MRR@20标准差
值:-34.360993502287066 - 类型:NAUC MRR@3差异1
值:19.311458613644003 - 类型:NAUC MRR@3最大值
值:-12.495078377194448 - 类型:NAUC MRR@3标准差
值:-34.72187448892093 - 类型:NAUC MRR@5差异1
值:19.28984692496265 - 类型:NAUC MRR@5最大值
值:-12.410164787044511 - 类型:NAUC MRR@5标准差
值:-34.008782372540274 - 类型:NAUC NDCG@1000差异1
值:22.334871936347476 - 类型:NAUC NDCG@1000最大值
值:-11.650741994163685 - 类型:NAUC NDCG@1000标准差
值:-33.95291620206335 - 类型:NAUC NDCG@100差异1
值:22.37733922760018 - 类型:NAUC NDCG@100最大值
值:-11.589691369551995 - 类型:NAUC NDCG@100标准差
值:-33.87967074881655 - 类型:NAUC NDCG@10差异1
值:22.435450031266548 - 类型:NAUC NDCG@10最大值
值:-10.425129788856612 - 类型:NAUC NDCG@10标准差
值:-34.021875869293375 - 类型:NAUC NDCG@1差异1
值:24.736009447964786 - 类型:NAUC NDCG@1最大值
值:-15.468802285096888 - 类型:NAUC NDCG@1标准差
值:-34.94706450308731 - 类型:NAUC NDCG@20差异1
值:22.690287768336383 - 类型:NAUC NDCG@20最大值
值:-11.01817585186346 - 类型:NAUC NDCG@20标准差
值:-33.855537917453795 - 类型:NAUC NDCG@3差异1
值:22.3679413098738 - 类型:NAUC NDCG@3最大值
值:-9.344141286897605 - 类型:NAUC NDCG@3标准差
值:-34.04026532887956 - 类型:NAUC NDCG@5差异1
值:22.379749690565344 - 类型:NAUC NDCG@5最大值
值:-8.914654859650676 - 类型:NAUC NDCG@5标准差
值:-32.83042128448497 - 类型:NAUC 精确率@1000差异1
值:11.379891065145626 - 类型:NAUC 精确率@1000最大值
值:33.6930576530585 - 类型:NAUC 精确率@1000标准差
值:67.69047934273685 - 类型:NAUC 精确率@100差异1
值:26.149909220953184 - 类型:NAUC 精确率@100最大值
值:44.74421471088036 - 类型:NAUC 精确率@100标准差
值:73.07539945227865 - 类型:NAUC 精确率@10差异1
值:25.663092824490043 - 类型:NAUC 精确率@10最大值
值:20.801697270838257 - 类型:NAUC 精确率@10标准差
值:-24.568452476876267 - 类型:NAUC 精确率@1差异1
值:24.736009447964786 - 类型:NAUC 精确率@1最大值
值:-15.468802285096888 - 类型:NAUC 精确率@1标准差
值:-34.94706450308731 - 类型:NAUC 精确率@20差异1
值:47.6822175290111 - 类型:NAUC 精确率@20最大值
值:50.99214578615923 - 类型:NAUC 精确率@20标准差
值:4.294200220909195 - 类型:NAUC 精确率@3差异1
值:22.832628569595652 - 类型:NAUC 精确率@3最大值
值:1.7043962267472152 - 类型:NAUC 精确率@3标准差
值:-31.67043197631448 - 类型:NAUC 精确率@5差异1
值:23.570424373006762 - 类型:NAUC 精确率@5最大值
值:11.289340977365226 - 类型:NAUC 精确率@5标准差
值:-23.100403202876947 - 类型:NAUC 召回率@1000差异1
值:11.379891065145936 - 类型:NAUC 召回率@1000最大值
值:33.69305765305101 - 类型:NAUC 召回率@1000标准差
值:67.6904793427376 - 类型:NAUC 召回率@100差异1
值:26.14990922095449 - 类型:NAUC 召回率@100最大值
值:44.74421471087856 - 类型:NAUC 召回率@100标准差
值:73.07539945228118 - 类型:NAUC 召回率@10差异1
值:25.663092824489333 - 类型:NAUC 召回率@10最大值
值:20.801697270838257 - 类型:NAUC 召回率@10标准差
值:-24.568452476876796 - 类型:NAUC 召回率@1差异1
值:24.736009447964786 - 类型:NAUC 召回率@1最大值
值:-15.468802285096888 - 类型:NAUC 召回率@1标准差
值:-34.94706450308731 - 类型:NAUC 召回率@20差异1
值:47.682217529011794 - 类型:NAUC 召回率@20最大值
值:50.992145786157735 - 类型:NAUC 召回率@20标准差
值:4.294200220909699 - 类型:NAUC 召回率@3差异1
值:22.832628569595713 - 类型:NAUC 召回率@3最大值
值:1.7043962267472765 - 类型:NAUC 召回率@3标准差
值:-31.67043197631441 - 类型:NAUC 召回率@5差异1
值:23.570424373006617 - 类型:NAUC 召回率@5最大值
值:11.289340977365105 - 类型:NAUC 召回率@5标准差
值:-23.10040320287697 - 类型:NDCG@1
值:56.757000000000005 - 类型:NDCG@10
值:77.31700000000001 - 类型:NDCG@100
值:78.109 - 类型:NDCG@1000
值:78.118 - 类型:NDCG@20
值:77.95400000000001 - 类型:NDCG@3
值:72.416 - 类型:NDCG@5
值:75.266 - 类型:精确率@1
值:56.757000000000005 - 类型:精确率@10
值:9.629999999999999
- 类型:主要得分
-
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers

支持多种语言
J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基于MS Marco段落排序任务训练的交叉编码器模型,用于信息检索中的查询-段落相关性评分
文本嵌入
英语
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
文本嵌入
Transformers

英语
O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基于PubMedBERT的生物医学实体表征模型,通过自对齐预训练优化语义关系捕捉
文本嵌入
英语
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一个强大的句子转换器模型,专注于句子相似度和文本嵌入任务,在多个基准测试中表现出色。
文本嵌入
英语
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一个英文句子转换器模型,专注于句子相似度任务,在多个文本嵌入基准测试中表现优异。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一个多语言的句子嵌入模型,支持超过50种语言,适用于句子相似度计算等任务。
文本嵌入
Transformers

支持多种语言
G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一个化学语言模型,旨在实现完全由机器驱动的超快聚合物信息学。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基于土耳其语BERT的句子嵌入模型,专为语义相似度任务优化
文本嵌入
Transformers

其他
B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基于BAAI/bge-small-en-v1.5模型微调的文本嵌入模型,通过MEDI数据集与MTEB分类任务数据集训练,优化了检索任务的查询编码能力。
文本嵌入
Safetensors
英语
G
avsolatorio
945.68k
29
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文