P

Pearl Small

由 Lihuchen 开发
珍珠小模型是一款轻量级字符串嵌入模型,专门用于处理字符串语义相似度计算,为字符串匹配、实体检索等任务生成优质嵌入向量。
下载量 1,824
发布时间 : 2/4/2024
模型介绍
内容详情
替代品

模型简介

该模型融合了短语类型信息和词形特征,能更精准捕捉字符串的形态变化。基于E5-small微调而成,可为短语和字符串生成更优质的向量表示。

模型特点

高质量短语表征
学习高质量通用短语表征,优于传统句子嵌入模型
轻量级设计
仅3400万参数,内存占用小,推理速度快
形态感知
融合词形特征,能精准捕捉字符串的形态变化

模型能力

计算字符串语义相似度
生成短语嵌入向量
实体检索
字符串匹配
实体聚类
模糊连接

使用案例

信息检索
实体链接
将文本中提到的实体链接到知识库中的标准实体
在YAGO数据集上达到48.1分
字符串匹配
匹配不同来源但语义相似的字符串
在PPDB数据集上达到97.0分
数据集成
模糊连接
连接不同数据源中表示相同实体的记录
在AutoFJ任务上达到75.2分