S

Sentence Luke Japanese Base Lite

由 sonoisa 开发
这是一个基于LUKE架构的日语句子嵌入模型,在内部测试中表现优于或等同于日文Sentence-BERT模型
下载量 2,690
发布时间 : 3/19/2023
模型介绍
内容详情
替代品

模型简介

该模型用于生成日语句子的嵌入向量,适用于句子相似度计算和特征提取等任务

模型特点

优于Sentence-BERT的性能
在内部测试中,该模型定量精度比日语Sentence-BERT模型高出约0.5个百分点,定性评估表现更优
基于LUKE架构
使用studio-ousia/luke-japanese-base-lite作为预训练基础,具有更好的上下文理解能力
句子级嵌入
专门针对句子级表示进行了优化,适合句子相似度计算任务

模型能力

日语句子嵌入
句子相似度计算
特征提取

使用案例

文本相似度
语义搜索
通过计算查询与文档的语义相似度来改进搜索结果
提高搜索结果的相关性
重复内容检测
识别不同表述但语义相似的文本
有效检测重复或高度相似的内容
信息检索
文档聚类
基于语义相似度对文档进行自动分组
实现更准确的文档分类和组织