M

Moco Sentencedistilbertv2.1

由 bongsoo 开发
这是一个基于蒸馏BERT的句子转换器模型,支持韩语和英语,用于句子相似度计算和特征提取。
下载量 37
发布时间 : 9/23/2022

模型简介

该模型将句子和段落映射到768维的密集向量空间,可用于聚类或语义搜索等任务。基于mdistilbertV2.1 MLM模型构建,通过STS师生蒸馏训练而成。

模型特点

多语言支持
支持韩语和英语的句子相似度计算。
高效蒸馏
通过师生蒸馏训练,在保持性能的同时减小模型尺寸。
768维向量空间
将句子映射到768维密集向量空间,适合语义搜索任务。

模型能力

句子相似度计算
特征提取
语义搜索
文本聚类

使用案例

信息检索
多语言问答系统
用于构建支持韩语和英语的问答系统,匹配问题与答案的相似度。
在korsts测试集上达到0.839的余弦斯皮尔曼相关系数
内容推荐
相似内容推荐
根据用户浏览内容推荐语义相似的新闻或文章。
AIbase
智启未来,您的人工智能解决方案智库
简体中文