T

Text2vec Base Chinese Sentence

由 shibing624 开发
基于CoSENT(余弦句子)模型的中文句子嵌入模型,将句子映射到768维稠密向量空间,可用于句子嵌入、文本匹配或语义搜索等任务。
下载量 1,895
发布时间 : 6/16/2023
模型介绍
内容详情
替代品

模型简介

该模型基于ERNIE-3.0-base-zh预训练模型,使用CoSENT方法在中文STS数据集上微调,专门用于中文句子相似度计算和语义匹配任务。

模型特点

高效句子嵌入
将中文句子高效映射到768维稠密向量空间,保留语义信息
优化的中文处理
基于ERNIE-3.0-base-zh预训练模型,针对中文文本进行了优化
高性能语义匹配
在多个中文NLI测试集上表现出色,平均斯皮尔曼相关系数达到59.87
广泛适用性
支持多种下游任务,包括文本匹配、语义搜索和信息检索

模型能力

文本向量化
特征提取
句子相似度计算
语义搜索
信息检索
文本聚类

使用案例

智能客服
问题相似度匹配
匹配用户问题与知识库中的相似问题
提高客服系统响应准确率
搜索引擎
语义搜索
理解查询意图,返回语义相关结果
提升搜索结果相关性
推荐系统
内容相似度推荐
基于内容语义相似度进行推荐
提高推荐内容的相关性