B

Bert Base 1024 Biencoder 64M Pairs

由 shreyansh26 开发
基于MosaicML预训练的1024序列长度BERT的长上下文双编码器,用于句子和段落嵌入
下载量 19
发布时间 : 8/22/2023
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到768维密集向量空间,可用于聚类或语义搜索等任务。

模型特点

长上下文支持
支持1024序列长度,适合处理长文档和段落
大规模训练
在64M随机采样的句子/段落对上进行了训练
高效检索
专为语义搜索和信息检索任务优化

模型能力

句子嵌入
段落嵌入
语义相似度计算
信息检索
文档聚类

使用案例

信息检索
语义搜索
构建搜索引擎的语义检索功能
在多个检索基准测试中表现良好
问答系统
用于检索与问题最相关的文档段落
文本分析
文档聚类
将相似内容的文档分组