G

Gte Base

由 thenlper 开发
GTE-Base 是一个通用的文本嵌入模型,专注于句子相似度和文本检索任务,在多个基准测试中表现良好。
下载量 317.05k
发布时间 : 7/27/2023
模型介绍
内容详情
替代品

模型简介

GTE-Base 是一个基于 transformer 的句子嵌入模型,主要用于生成高质量的句子嵌入,适用于文本相似度计算、信息检索和文本分类等任务。

模型特点

多任务性能优异
在句子相似度、文本分类、聚类和检索等多种任务上表现均衡且优异
高质量句子嵌入
能够生成高质量的句子级嵌入表示,适用于各种下游NLP任务
广泛基准测试验证
在MTEB等多个标准基准测试集上进行了全面评估

模型能力

句子相似度计算
文本分类
文本聚类
信息检索
语义搜索
文本重排序

使用案例

电子商务
产品评论分类
对亚马逊产品评论进行情感极性分类
在AmazonPolarity数据集上达到91.77%准确率
反事实评论检测
识别亚马逊上的反事实评论
在AmazonCounterfactual数据集上达到74.18%准确率
客户服务
银行业务意图分类
对银行客户查询进行意图分类
在Banking77数据集上达到85.07%准确率
学术研究
论文聚类
对arXiv和biorxiv论文进行主题聚类
在ArxivClusteringP2P上v_measure达到48.60%