S

ST NLI Ca Paraphrase Multilingual Mpnet Base

由 projecte-aina 开发
基于sentence-transformers的多语言句子嵌入模型,支持加泰罗尼亚语,可将文本映射到768维向量空间
下载量 56
发布时间 : 11/7/2023
模型介绍
内容详情
替代品

模型简介

该模型通过进一步训练多语言模型paraphrase-multilingual-mpnet-base-v2开发而成,使用加泰罗尼亚语NLI数据训练,适用于句子相似度计算、语义搜索等任务

模型特点

多语言支持
基于多语言模型开发,特别针对加泰罗尼亚语优化
NLI训练
使用自然语言推理数据进行训练,包括TE-ca和XNLI的加泰罗尼亚语翻译版本
高质量嵌入
能生成768维的高质量句子嵌入,适用于语义相似度任务

模型能力

句子嵌入
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
相似文档搜索
根据查询句子查找语义相似的文档
文本分析
文本聚类
将语义相似的句子或文档分组