S

Semantic Xlmr

由 headlesstech 开发
基于sentence-transformers的多语言句子嵌入模型,特别针对孟加拉语进行优化,适用于语义相似度计算和聚类分析
下载量 28
发布时间 : 4/5/2023
模型介绍
内容详情
替代品

模型简介

该模型能够将句子和段落映射到768维稠密向量空间,主要用于语义相似度计算、聚类分析和语义搜索等任务

模型特点

多语言支持
基于XLM-RoBERTa架构,支持多种语言,特别针对孟加拉语进行了优化
知识蒸馏训练
采用paraphrase-distilroberta-base-v2作为教师模型进行知识蒸馏训练,提高模型性能
高效语义编码
能够将文本转换为768维稠密向量,保留语义信息,适合大规模语义搜索

模型能力

句子相似度计算
文本聚类分析
语义搜索
多语言文本编码

使用案例

信息检索
文档检索系统
构建基于语义的文档检索系统,提高搜索结果的相关性
推荐系统
内容推荐
根据用户历史行为和内容语义相似度进行个性化推荐
智能客服
FAQ匹配
将用户问题与知识库中的常见问题进行语义匹配