U

Unsup Simcse Ja Large

由 cl-nagoya 开发
这是一个基于无监督学习的日语句子嵌入模型,专门用于生成高质量的日语句子嵌入表示。
下载量 59
发布时间 : 10/2/2023
模型介绍
内容详情
替代品

模型简介

该模型使用无监督SimCSE方法训练,能够将日语句子转换为高维向量表示,适用于句子相似度计算等任务。

模型特点

无监督学习
采用无监督SimCSE方法训练,无需标注数据即可学习有效的句子表示
日语优化
专门针对日语文本进行优化,能够更好地捕捉日语语言特征
高质量嵌入
生成的句子嵌入可用于各种下游任务,如相似度计算、聚类等

模型能力

句子嵌入生成
句子相似度计算
文本特征提取

使用案例

信息检索
相似文档查找
通过比较句子嵌入查找语义相似的文档
可提高检索相关性和准确性
文本聚类
主题分析
基于句子嵌入对文本进行聚类分析
可自动发现文本中的主题结构