J

Japanese Reranker Tiny V2

由 hotchpotch 开发
这是一个非常小巧且快速的日语重排序模型,适用于提升RAG系统的精度,在CPU或边缘设备上也能高效运行。
下载量 339
发布时间 : 5/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个日语文本重排序器,主要用于对检索到的文档进行重新排序以提高相关性。基于ModernBert架构,特别优化了在资源受限环境下的性能。

模型特点

轻量高效
仅3层架构,在CPU或Apple Silicon环境下也能以实用速度运行
资源友好
无需昂贵GPU资源即可提升RAG系统的精度
边缘设备兼容
适用于边缘设备部署或对延迟要求较高的生产环境
优化推理
支持Flash Attention 2加速和ONNX量化优化

模型能力

日语文本相关性评分
检索结果重排序
快速推理

使用案例

信息检索
文档检索优化
对搜索引擎返回的结果进行重新排序以提高相关性
在JQaRA数据集上达到0.6455的评分
问答系统
问答候选答案排序
对问答系统生成的候选答案进行相关性排序
在JSQuAD数据集上达到0.9608的评分