G

Gte Multilingual Mlm Base

由 Alibaba-NLP 开发
mGTE系列多语言文本编码器,支持75种语言,最大上下文长度8192,基于BERT+RoPE+GLU架构,在GLUE和XTREME-R基准上表现优异
下载量 342
发布时间 : 8/6/2024
模型介绍
内容详情
替代品

模型简介

通用多语言文本编码器,专注于长上下文文本表示与重排序,适用于多语言检索任务

模型特点

超长上下文支持
支持8192的最大序列长度,适合处理长文档
多语言能力
支持75种语言,在多语言基准测试XTREME-R上表现优异
改进的架构设计
采用BERT+RoPE+GLU的transformer++架构,结合旋转位置编码(RoPE)和门控线性单元(GLU)
多阶段训练策略
采用从短序列到长序列的分阶段训练方法,有效支持长上下文建模

模型能力

多语言文本编码
长文本表示
文本重排序
跨语言检索

使用案例

信息检索
跨语言文档检索
在多语言环境下检索相关文档
在XTREME-R基准上达到64.44分,优于XLM-R-base
自然语言理解
多语言文本分类
对多语言文本进行分类任务
在GLUE基准上达到83.47分