A

Araeurobert 210M

由 Omartificial-Intelligence-Space 开发
基于EuroBERT-210m微调的阿拉伯语语义嵌入模型,支持Matryoshka嵌入技术
下载量 304
发布时间 : 3/11/2025
模型介绍
内容详情
替代品

模型简介

专为阿拉伯语文本优化的句子转换模型,可将句子映射到768维向量空间,支持多种嵌入维度以适应不同效率需求

模型特点

Matryoshka嵌入技术
支持灵活调整嵌入维度(768/512/256/128/64),无需重新训练即可平衡性能与效率
长文本支持
最大序列长度达8,192个标记,适合处理长文档
阿拉伯语优化
针对阿拉伯语特性进行专门优化,相比基础模型在STS任务上有显著提升
多损失函数训练
结合MatryoshkaLoss与MultipleNegativesRankingLoss进行训练

模型能力

语义文本相似度计算
语义搜索
信息检索
文档聚类
问答系统
复述检测
零样本分类

使用案例

信息检索
阿拉伯语搜索引擎
用于构建阿拉伯语内容的语义搜索引擎
提高搜索结果的相关性和准确性
文本分析
文档相似度分析
分析阿拉伯语文档间的语义相似度
在STS17任务上相对提升73.5%