S

SGPT 125M Weightedmean Nli Bitfit

由 Muennighoff 开发
SGPT-125M是一个基于加权平均和自然语言推理(NLI)微调的句子转换器模型,用于句子相似度计算和特征提取。
下载量 326
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于句子相似度计算和文本特征提取,通过加权平均和自然语言推理微调优化了多语言文本处理能力。

模型特点

多任务评估能力
在MTEB(多任务评估基准)的多种任务上表现良好,包括分类、聚类、检索等
多语言支持
支持多种语言的文本处理,包括英文、德文、西班牙文、法文、日文和中文
加权平均优化
采用加权平均方法优化句子表示,提高相似度计算准确性
NLI微调
通过自然语言推理(NLI)任务进行微调,增强语义理解能力

模型能力

句子相似度计算
文本特征提取
多语言文本分类
文档聚类
信息检索
搜索结果重排序
语义文本相似度评估
双语文本挖掘

使用案例

电子商务
亚马逊评论分类
对亚马逊多语言商品评论进行分类
英文评论分类准确率35.098%,德文24.516%,西班牙文29.098%
反事实分类
识别亚马逊评论中的反事实陈述
英文准确率65.88%,德文59.08%,日文56.42%
学术研究
arXiv论文聚类
对arXiv学术论文进行点对点和句子对句子聚类
点对点V度量34.74,句子对句子V度量24.68
biorxiv论文聚类
对biorxiv生物学论文进行聚类分析
点对点V度量28.93,句子对句子V度量23.08
问答系统
AskUbuntu重复问题检测
识别AskUbuntu论坛中的重复问题
平均精度52.63%,平均倒数排名65.76%