G

Gte Modernbert Base

由 Alibaba-NLP 开发
基于ModernBERT预训练编码器的文本嵌入模型,支持8192 tokens长文本处理,在MTEB、LoCO和COIR等评估任务中表现优异。
下载量 74.52k
发布时间 : 1/20/2025
模型介绍
内容详情
替代品

模型简介

该模型是阿里巴巴集团通义实验室开发的文本嵌入模型,专注于英语文本处理,适用于信息检索、语义相似度计算等任务。

模型特点

长文本处理能力
支持最大8192 tokens的输入长度,适合处理长文档
高效性能
支持Flash Attention 2加速,在GPU上运行效率高
多场景适用
在MTEB、LoCO和COIR等多种评估任务中表现优异

模型能力

文本嵌入
语义相似度计算
信息检索
长文档处理

使用案例

信息检索
文档检索
在大规模文档库中快速检索相关内容
在LoCO评估中NDCG@10达到88.88
语义相似度
问答匹配
计算问题与候选答案的语义相似度
在MTEB语义相似度任务中得分81.57