S

SA BERT V1

由 Omartificial-Intelligence-Space 开发
SA-BERT-V1是基于MARBERTv2微调的沙特方言嵌入模型,专为处理沙特阿拉伯方言设计,提供高质量的句子嵌入。
下载量 31
发布时间 : 5/12/2025
模型介绍
内容详情
替代品

模型简介

SA-BERT-V1是一个针对沙特阿拉伯方言优化的句子嵌入模型,基于UBC-NLP/MARBERTv2预训练模型微调,适用于语义相似度、聚类、检索和分类任务。

模型特点

沙特方言优化
专门针对沙特阿拉伯方言进行微调,提升了方言理解和处理能力。
高性能嵌入
在内部与跨类别相似度差距上提升了+0.0022,44个专业类别中平均余弦分数达到0.98。
多样数据训练
使用超过50万条沙特方言句子进行微调,涵盖多样主题和地区变体。

模型能力

语义相似度计算
文本聚类
信息检索
下游分类任务

使用案例

自然语言处理
沙特方言语义相似度分析
用于计算沙特方言句子之间的语义相似度。
在测试集上达到0.98的平均余弦相似度。
沙特方言文本聚类
对沙特方言文本进行聚类分析。
在沙特方言聚类任务中表现优异。
信息检索
沙特方言文档检索
用于构建沙特方言的文档检索系统。