M

Micse

由 sap-ai-research 开发
miCSE是一个专为句子相似度计算而设计的低样本量句子嵌入模型,通过注意力模式对齐和正则化自注意力分布实现高效的样本学习。
下载量 30
发布时间 : 11/9/2022
模型介绍
内容详情
替代品

模型简介

miCSE模型通过学习强制实现不同dropout增强视角间的句法一致性,通过正则化自注意力分布使表征学习更具样本效率,特别适合训练数据有限的场景。

模型特点

低样本量学习
通过正则化自注意力分布实现高效的样本学习,适合训练数据有限的场景。
注意力模式对齐
通过强制不同数据增强视角间的注意力模式对齐进行训练,提高模型性能。
句法一致性
学习强制实现不同dropout增强视角间的句法一致性,提升表征质量。

模型能力

句子相似度计算
文本检索
句子聚类

使用案例

信息检索
文档检索
使用miCSE生成的句子嵌入进行相似文档检索。
文本分析
句子聚类
利用miCSE对句子进行嵌入后,使用聚类算法对相似句子进行分组。
如示例2所示,能够有效区分不同情感倾向的推文。
语义相似度计算
计算两个句子之间的余弦相似度,评估其语义相似性。
如示例1所示,能够准确计算句子间的相似度。