U

Unsup Simcse Bert Large Uncased

由 princeton-nlp 开发
SimCSE是一种简单的对比学习框架,用于生成高质量的句子嵌入,特别适用于无监督学习场景。
下载量 32
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于BERT架构,通过对比学习方式优化句子嵌入表示,可用于特征提取和语义相似度计算等任务。

模型特点

无监督对比学习
采用简单的对比学习框架,无需标注数据即可训练高质量的句子嵌入
BERT架构优化
基于BERT-large架构进行优化,保持良好对齐性的同时提升一致性
高效训练
使用相对较小的批处理量(64)和学习率(1e-5)进行训练

模型能力

句子嵌入生成
语义相似度计算
文本特征提取

使用案例

语义分析
语义文本相似度计算
计算两个句子之间的语义相似度
在STS任务上表现出色
信息检索
文档检索
基于语义相似度的文档检索系统