R

Ruri Large V2

由 cl-nagoya 开发
Ruri是一个日语通用文本嵌入模型,专注于句子相似度计算和特征提取,支持长文本处理。
下载量 3,672
发布时间 : 12/6/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于日语句子相似度计算和文本特征提取,能够生成高质量的文本嵌入表示,适用于信息检索、聚类分析等任务。

模型特点

长文本支持
最大支持512个标记的序列长度,适合处理较长文本
高性能
在JMTEB基准测试中表现优异,平均得分74.55
前缀感知
能够区分查询文本和段落文本,通过特定前缀优化相似度计算

模型能力

日语句子相似度计算
文本特征提取
信息检索
文本聚类
语义搜索

使用案例

信息检索
问答系统
用于查找与用户查询最相关的答案段落
在重排序任务中达到93.21的高分
文本分析
文档聚类
将语义相似的文档自动分组
在聚类任务中得分52.14