M

Mstsb Paraphrase Multilingual Mpnet Base V2

由 AIDA-UPM 开发
基于sentence-transformers的paraphrase-multilingual-mpnet-base-v2模型微调版本,针对15种语言的语义文本相似度任务优化
下载量 404
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到768维密集向量空间,支持多语言文本的聚类、语义搜索及相似度测量任务

模型特点

多语言支持
支持15种语言的语义相似度计算,包括阿拉伯语、中文、英语等
高质量微调
使用扩展至15种语言的STSb数据集进行微调,确保跨语言性能
语义理解
能够捕捉句子深层语义,适用于复杂语义匹配场景

模型能力

句子嵌入生成
跨语言语义搜索
文本聚类分析
语义相似度计算

使用案例

信息检索
多语言文档搜索
构建支持多种语言的语义搜索引擎
提升非英语文档的检索准确率
内容分析
跨语言内容去重
识别不同语言表达的相似内容
减少多语言平台的内容冗余