K

Klue Sroberta Base Continue Learning By Mnr

由 bespin-global 开发
这是一个基于KLUE/NLI和KLUE/STS数据集训练的韩语句子嵌入模型,采用sentence-transformers框架,通过两阶段训练优化句子相似度任务。
下载量 88.10k
发布时间 : 4/4/2022
模型介绍
内容详情
替代品

模型简介

该模型能够将韩语句子和段落映射到768维稠密向量空间,适用于聚类、语义搜索等自然语言处理任务。

模型特点

两阶段训练
先使用NLI数据集进行负采样训练,再使用STS数据集优化相似度任务
高效语义表示
能够生成高质量的句子嵌入向量,有效捕捉语义信息
韩语优化
专门针对韩语文本进行训练和优化

模型能力

句子嵌入
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
相似文档检索
根据查询句子查找语义相似的文档
高准确度的相似文档匹配
文本分析
文本聚类
将语义相似的文本分组
有效的主题聚类