L

Llm2vec Meta Llama 3 8B Instruct Mntp

由 McGill-NLP 开发
LLM2Vec是将仅解码器架构的大语言模型转化为文本编码器的简易方案,通过启用双向注意力机制、掩码下一词预测和无监督对比学习实现。
下载量 3,885
发布时间 : 4/30/2024
模型介绍
内容详情
替代品

模型简介

该模型通过三步转换方案将大语言模型转化为强大的文本编码器,支持文本嵌入、信息检索、文本分类等多种任务。

模型特点

双向注意力机制
通过启用双向注意力机制,使仅解码器架构的LLM能够更好地理解上下文信息。
掩码下一词预测
采用掩码下一词预测(MNTP)技术增强模型的文本表示能力。
无监督对比学习
通过无监督对比学习进一步提升模型的文本编码质量。
指令感知编码
支持指令前缀的文本编码,适用于检索增强生成等场景。

模型能力

文本嵌入
信息检索
文本分类
文本聚类
语义相似度计算
特征提取
文本重排序

使用案例

信息检索
问答系统检索
使用指令编码查询语句,检索相关文档段落
高相关度文档检索
文本分析
语义相似度计算
计算不同文本之间的语义相似度
准确的相似度评分