E

Erlangshen SimCSE 110M Chinese

由 IDEA-CCNL 开发
基于SimCSE无监督版本,采用中文NLI数据进行有监督对比学习训练的中文句子向量表征模型
下载量 186
发布时间 : 11/7/2022
模型介绍
内容详情
替代品

模型简介

该模型通过对比学习训练,可直接提取句向量进行相似度计算,无需微调即可用于中文句对匹配任务

模型特点

中文优化
专门针对中文语言特性进行优化训练
直接句向量提取
无需微调即可通过[CLS]标记输出进行相似度判定
对比学习训练
采用无监督与有监督结合的对比学习方法

模型能力

中文句子向量表征
句子相似度计算
文本匹配

使用案例

文本匹配
问答系统
用于匹配用户问题与知识库中的候选答案
提高问答准确率
语义搜索
增强搜索引擎对查询语句的理解能力
提升搜索结果相关性
自然语言理解
文本分类
作为文本分类任务的特征提取器