L

Llm2vec Meta Llama 31 8B Instruct Mntp Unsup Simcse

由 McGill-NLP 开发
LLM2Vec是一种将仅解码器架构的大语言模型转换为文本编码器的方案,通过启用双向注意力、掩码下一词预测和无监督对比学习实现转换。
下载量 55
发布时间 : 10/8/2024
模型介绍
内容详情
替代品

模型简介

该模型通过三步转换方案将大语言模型转变为文本编码器,支持文本嵌入、信息检索等任务,并可进一步微调提升性能。

模型特点

双向注意力机制
通过启用双向注意力机制增强模型对上下文的理解能力
无监督对比学习
采用无监督对比学习方法提升文本表示质量
微调兼容性
支持进一步微调以达到业界领先性能水平

模型能力

文本嵌入生成
信息检索
文本语义相似度计算
文本分类
文本聚类

使用案例

信息检索
网络搜索查询匹配
将用户查询与相关文档进行匹配检索
示例显示查询与相关文档的余弦相似度达到0.6
问答系统
蛋白质摄入量问答
回答关于女性每日蛋白质摄入量的问题
模型能准确匹配CDC指南相关内容