K

Ko Sroberta Multitask

由 jhgan 开发
这是一个基于sentence-transformers的韩语句子嵌入模型,能够将句子和段落映射到768维的密集向量空间,适用于聚类或语义搜索等任务。
下载量 162.23k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于RoBERTa架构,经过多任务学习训练,专门用于处理韩语句子的嵌入表示,支持句子相似度计算和特征提取。

模型特点

多任务学习
模型使用KorSTS和KorNLI训练数据集进行多任务学习,提高了句子嵌入的质量。
高效语义表示
能够将句子和段落高效地映射到768维的密集向量空间,保留语义信息。
韩语优化
专门针对韩语进行优化,适合处理韩语句子的嵌入和相似度计算。

模型能力

句子嵌入
语义搜索
文本聚类
句子相似度计算

使用案例

自然语言处理
语义搜索
使用句子嵌入进行高效的语义搜索,找到与查询句子语义相似的文档或段落。
文本聚类
将大量韩语文本聚类成具有相似语义的组别,用于文本分类或信息组织。