U

Unsup Simcse Bert Base Uncased

由 princeton-nlp 开发
基于BERT架构的无监督对比学习模型,通过简单有效的对比学习框架提升句子嵌入质量
下载量 9,546
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用对比学习框架SimCSE,通过无监督方式学习句子嵌入表示,适用于特征提取任务

模型特点

无监督对比学习
仅需原始文本即可学习高质量句子嵌入,无需标注数据
简单高效
通过dropout机制构建正样本对,无需复杂数据增强
各向同性优化
有效改善预训练模型的各向异性问题,提升嵌入空间一致性

模型能力

句子嵌入提取
语义相似度计算
文本特征表示学习

使用案例

语义检索
文档相似度匹配
计算文档/句子间的语义相似度
在STS任务上表现优异
下游NLP任务
迁移学习特征提取
作为预训练特征用于分类/聚类任务