I

Instructor Xl

由 retrainai 开发
一个基于T5架构的句子嵌入模型,专注于英语文本的语义相似度和信息检索任务。
下载量 22
发布时间 : 12/28/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个基于T5架构的句子嵌入模型,主要用于计算句子相似度、信息检索、文本分类和聚类等自然语言处理任务。它在多个标准数据集上表现出色,特别是在语义相似度和检索任务中。

模型特点

多任务性能
在句子相似度、信息检索、文本分类和聚类等多种任务上表现优异
强大的语义理解
基于T5架构,能够深入理解文本语义,生成高质量的句子嵌入
广泛评估
在MTEB等多个标准数据集上进行了全面评估,验证了其有效性

模型能力

句子相似度计算
信息检索
文本分类
文本聚类
特征提取
文本重排序
提示检索

使用案例

信息检索
问答系统
用于检索与用户问题最相关的答案
在CQADupstack数据集上map@100达到38.79
文档检索
从大量文档中检索相关内容
在ArguAna数据集上ndcg@100达到58.88
文本分类
情感分析
对文本进行正面/负面情感分类
在AmazonPolarity数据集上准确率达到86.54%
意图识别
识别用户查询的意图类别
在Banking77数据集上准确率达到82.66%
语义相似度
重复问题检测
识别语义相似的问题
在AskUbuntuDupQuestions数据集上map达到65.35
语义搜索
基于语义而非关键词匹配的搜索
在BIOSSES数据集上余弦相似度斯皮尔曼相关达到84.15