I

Instructor Base

由 hkunlp 开发
基于T5架构的文本嵌入模型,专注于句子相似度计算和文本检索任务,在多个基准测试中表现优异。
下载量 13.22k
发布时间 : 12/20/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于T5架构的文本嵌入模型,主要用于生成高质量的句子嵌入向量,支持信息检索、文本分类、聚类和语义相似度计算等多种自然语言处理任务。

模型特点

多任务性能优异
在MTEB基准测试的多个任务中表现优秀,包括分类、聚类和检索任务
高效文本嵌入
能够生成高质量的句子嵌入向量,适用于大规模信息检索场景
广泛适用性
支持多种下游NLP任务,包括相似度计算、分类和聚类等

模型能力

句子相似度计算
文本嵌入生成
信息检索
文本分类
文本聚类
语义搜索
文本重排序

使用案例

电子商务
产品评论分类
对亚马逊产品评论进行情感分析分类
在AmazonPolarity分类任务中达到88.36%准确率
反事实检测
识别亚马逊产品评论中的反事实陈述
在AmazonCounterfactual分类任务中达到86.21%准确率
金融
银行客服分类
对银行客户咨询进行分类
在Banking77分类任务中达到77.04%准确率
学术研究
论文聚类
对arXiv和biorxiv论文进行主题聚类
在ArxivClusteringP2P任务中达到39.68 v_measure分数