R

Ruri Small V2

由 cl-nagoya 开发
瑠璃是一个日语通用文本嵌入模型,专注于句子相似度计算和特征提取,基于cl-nagoya/ruri-pt-small-v2基础模型训练。
下载量 55.95k
发布时间 : 12/5/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于日语文本的句子相似度计算和特征提取,支持添加查询前缀进行语义搜索任务。

模型特点

优化的日语文本处理
专门针对日语文本进行优化,能够准确捕捉日语语义特征
前缀感知
支持通过添加'クエリ:'和'文章:'前缀区分查询和文档文本
高效性能
在68M参数规模下达到与更大模型相当的性能

模型能力

日语文本嵌入
句子相似度计算
语义搜索
特征提取

使用案例

信息检索
问答系统
用于构建日语问答系统,匹配问题与相关答案
在JMTEB评估中检索任务得分73.94
文本分析
语义相似度分析
计算两个日语文本片段的语义相似度
在JMTEB语义相似度任务中得分82.91