T

Tooka SBERT

由 PartAI 开发
这是一个基于TookaBERT-Large的波斯语句子嵌入模型,可将文本映射到1024维向量空间,用于语义相似度计算等任务。
下载量 2,847
发布时间 : 12/3/2024
模型介绍
内容详情
替代品

模型简介

该模型是专为波斯语设计的句子转换器,能够将句子和段落转换为密集向量表示,适用于语义文本相似性、语义搜索、文本分类和聚类等任务。

模型特点

波斯语优化
专门针对波斯语文本进行优化,能够准确捕捉波斯语语义特征
高效相似度计算
使用余弦相似度快速计算句子间的语义相似度
大规模预训练
基于TookaBERT-Large预训练模型,具有强大的语义表示能力

模型能力

语义文本相似度计算
语义搜索
复述挖掘
文本分类
文本聚类

使用案例

信息检索
相似文档检索
在波斯语文档库中查找语义相似的文档
内容推荐
相关内容推荐
根据用户浏览内容推荐语义相似的波斯语内容
文本分析
文本聚类分析
对波斯语文本进行自动聚类分析