D

Diffcse Bert Base Uncased Sts

由 voidism 开发
DiffCSE是一种无监督对比学习框架,用于学习对句子差异敏感的句子嵌入,通过随机掩码和掩码语言模型采样生成编辑句子,提升语义文本相似性任务表现。
下载量 50
发布时间 : 4/13/2022
模型介绍
内容详情
替代品

模型简介

DiffCSE通过学习对原始句子与编辑后句子之间差异敏感的句子嵌入,其中编辑后的句子是通过随机掩码原始句子并从掩码语言模型中采样得到的。该方法在无监督句子表示学习中取得了最先进的结果。

模型特点

差异敏感的句子嵌入
通过学习对原始句子与编辑后句子之间差异敏感的表示,提升语义理解能力
无监督对比学习
无需标注数据即可训练,利用自监督信号学习高质量句子表示
等变对比学习
泛化对比学习框架,学习对某些增强不敏感而对其他增强敏感的表示

模型能力

句子嵌入生成
语义相似度计算
文本表示学习

使用案例

语义理解
语义文本相似性
计算两个句子之间的语义相似度
在STS任务上比无监督SimCSE高出2.3个绝对百分点
信息检索
文档检索
基于语义相似度的文档检索系统