T

Text2vec Base Chinese

由 shibing624 开发
基于CoSENT(余弦句子)模型的中文文本嵌入模型,可将句子映射到768维稠密向量空间,适用于句子嵌入、文本匹配或语义搜索等任务。
下载量 605.98k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用CoSENT方法训练,基于hfl/chinese-macbert-base在中文STS-B数据训练得到,在中文STS-B测试集评估表现优异。

模型特点

高效中文语义匹配
在中文文本匹配任务中表现优异,适用于通用语义匹配场景。
基于CoSENT方法
采用余弦句子(CoSENT)方法训练,优化句子嵌入的相似度计算。
768维稠密向量
将句子映射到768维稠密向量空间,适合下游任务处理。

模型能力

句子嵌入
文本匹配
语义搜索

使用案例

文本相似度计算
问答系统
用于计算问题与候选答案的语义相似度
提升问答匹配准确率
信息检索
增强搜索引擎的语义理解能力
提高搜索结果相关性
自然语言处理
文本聚类
用于相似文本的自动聚类
文本分类
作为文本分类任务的输入特征