L

Lt Wikidata Comp Multi

由 dell-research-harvard 开发
基于sentence-transformers/paraphrase-multilingual-mpnet-base-v2微调的多语言句子相似度模型,支持12种语言的语义匹配任务
下载量 415
发布时间 : 8/29/2023
模型介绍
内容详情
替代品

模型简介

该模型专为记录链接(实体匹配)任务设计,可用于聚类、去重、关联等场景,支持德语、英语、中文等12种语言的句子相似度计算

模型特点

多语言支持
支持12种主要语言的句子相似度计算,包括欧洲和亚洲主要语种
实体匹配优化
专门针对公司别名匹配等实体链接任务进行优化训练
高效推理
基于优化的sentence-transformers框架,提供快速的句子嵌入计算

模型能力

多语言句子相似度计算
实体匹配与链接
文本聚类分析
语义搜索
记录去重

使用案例

企业数据管理
公司名称标准化
将不同来源的公司名称变体匹配到标准名称
提高企业数据库的整洁度和一致性
多语言应用
跨语言文档检索
在不同语言的文档中查找语义相似的内容
支持多语言环境下的知识发现