D

Diffcse Bert Base Uncased Trans

由 voidism 开发
DiffCSE是一种无监督对比学习框架,用于学习对句子差异敏感的句子嵌入。
下载量 14
发布时间 : 4/14/2022
模型介绍
内容详情
替代品

模型简介

DiffCSE通过学习原始句子和编辑后句子之间的差异来生成句子嵌入,其中编辑后的句子是通过随机掩码原始句子并从掩码语言模型中采样得到的。该方法在语义文本相似性任务上表现优异。

模型特点

差异敏感的句子嵌入
通过学习原始句子和编辑后句子之间的差异来生成更具表达力的句子嵌入
无监督对比学习
不需要标注数据即可训练,利用自监督学习目标
等变对比学习
对某些类型的增强不敏感而对其他'有害'类型的增强敏感

模型能力

句子嵌入生成
语义相似度计算
文本表示学习

使用案例

自然语言处理
语义文本相似性
计算两个句子之间的语义相似度
在STS任务上比无监督SimCSE高出2.3个绝对点
信息检索
基于语义相似度的文档检索