M

M2 Bert 80M 2k Retrieval

由 togethercomputer 开发
这是一个80M参数的M2-BERT预训练检查点,序列长度为2048,并已针对长上下文检索任务进行微调。
下载量 538
发布时间 : 11/13/2023
模型介绍
内容详情
替代品

模型简介

Monarch Mixer-BERT模型是一种基于GEMM的次二次方架构,专门针对长上下文检索任务进行了优化,能够生成高质量的嵌入向量用于信息检索。

模型特点

长序列处理能力
支持长达2048的序列长度,适合处理长文本内容
高效检索
针对检索任务进行了专门优化,能生成高质量的768维嵌入向量
次二次方架构
采用Monarch Mixer架构,基于GEMM实现高效计算

模型能力

长文本嵌入生成
句子相似度计算
信息检索

使用案例

信息检索
文档检索
可用于构建文档检索系统,根据查询内容找到相关文档
语义搜索
支持基于语义而非关键词的搜索功能