I

Instructor Large Safetensors

由 gentlebowl 开发
INSTRUCTOR 是一个基于 T5 架构的文本嵌入模型,专注于句子相似度计算和信息检索任务。它在多种 NLP 任务上表现出色,包括文本分类、聚类和语义相似度评估。
下载量 16
发布时间 : 4/25/2023
模型介绍
内容详情
替代品

模型简介

INSTRUCTOR 是一个强大的文本嵌入模型,能够将文本转换为高质量的向量表示,适用于信息检索、文本分类、聚类和语义相似度计算等多种自然语言处理任务。

模型特点

多任务支持
支持多种 NLP 任务,包括句子相似度、信息检索、文本分类和聚类等。
高性能
在多个基准测试数据集上表现出色,如 MTEB、BEIR 等。
灵活的嵌入向量
能够生成高质量的文本嵌入向量,适用于各种下游任务。

模型能力

句子相似度计算
信息检索
文本分类
文本聚类
语义相似度评估
提示检索
文本重排序

使用案例

信息检索
文档检索
使用 INSTRUCTOR 嵌入向量进行高效的文档检索。
在 CQADupstack 数据集上表现出色,平均精度@10 达到 38.1365。
文本分类
情感分析
使用 INSTRUCTOR 进行文本情感分类。
在 AmazonPolarity 数据集上准确率达到 91.526%。
语义相似度
句子相似度计算
计算两个句子之间的语义相似度。
在 BIOSSES 数据集上余弦相似度斯皮尔曼相关系数达到 84.387。