S

Simcse Indobert Base

由 LazarusNLP 开发
基于IndoBERT的SimCSE模型,用于生成印尼语句子的语义嵌入向量
下载量 26
发布时间 : 5/27/2023
模型介绍
内容详情
替代品

模型简介

这是一个基于sentence-transformers的模型,能够将印尼语的句子和段落映射到768维的密集向量空间,可用于聚类或语义搜索等任务。

模型特点

印尼语专用
专门针对印尼语优化的句子嵌入模型
高维语义空间
将句子映射到768维的密集向量空间
SimCSE训练
使用对比学习(SimCSE)方法训练,提升句子表示质量

模型能力

句子嵌入生成
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
相似文档检索
在印尼语文档集合中查找语义相似的文档
文本分析
主题聚类
对印尼语文本进行基于语义的主题聚类分析