G

GATE AraBert V1

由 Omartificial-Intelligence-Space 开发
GATE-AraBert-V1 是一个通用阿拉伯语文本嵌入模型,通过多任务训练在 AllNLI 和 STS 数据集上优化语义文本相似度任务。
下载量 4,418
发布时间 : 8/3/2024

模型简介

该模型是基于 SentenceTransformers 训练的阿拉伯语文本嵌入系统,主要用于增强语义文本相似度计算,采用混合损失训练方法。

模型特点

多任务训练
在 AllNLI 和 STS 数据集上进行多任务训练,优化语义相似度计算
混合损失训练
采用混合损失训练方法提升模型性能
长文本支持
支持最大512个标记的序列长度
高维嵌入
输出768维的高质量文本嵌入

模型能力

阿拉伯语文本嵌入
语义相似度计算
文本表示学习

使用案例

自然语言处理
语义搜索
用于阿拉伯语内容的语义搜索系统
提高搜索结果的相关性
文本聚类
阿拉伯语文档的自动聚类
改善文档组织效率
问答系统
阿拉伯语问答系统中的问题匹配
提升答案准确性
AIbase
智启未来,您的人工智能解决方案智库
简体中文