L

Llm2vec Sheared LLaMA Mntp

由 McGill-NLP 开发
LLM2Vec是将仅解码器架构的大语言模型转化为文本编码器的简易方案,通过启用双向注意力、掩码下一词预测和无监督对比学习实现。
下载量 2,430
发布时间 : 4/4/2024
模型介绍
内容详情
替代品

模型简介

LLM2Vec是一种将大语言模型转换为高效文本编码器的技术方案,适用于文本相似度计算、信息检索等任务。

模型特点

双向注意力机制
通过启用双向注意力,使模型能够更好地理解上下文信息。
掩码下一词预测
采用掩码下一词预测技术提升模型的文本理解能力。
无监督对比学习
利用无监督对比学习优化模型性能,无需大量标注数据。
简易转换方案
仅需三个简单步骤即可将解码器LLM转换为高效文本编码器。

模型能力

文本嵌入
文本语义相似度计算
信息检索
文本分类
文本聚类
特征提取

使用案例

信息检索
网页搜索查询匹配
根据用户查询检索相关段落
高准确度的查询-文档匹配
文本分析
文档相似度分析
计算不同文档间的语义相似度
有效的文档聚类和分类