Q

Qwen3 Reranker 0.6B W4A16 G128

由 boboliu 开发
Qwen3-Reranker-0.6B的GPTQ量化版本,显存使用优化且精度损失小
下载量 151
发布时间 : 6/7/2025

模型简介

这是一个基于Qwen/Qwen3-Reranker-0.6B的GPTQ量化模型,主要用于文本分类任务。通过量化技术显著降低了显存使用量,同时保持了较高的精度。

模型特点

显存优化
显存使用量从3228M降至2124M(无FA2),显著提升资源效率
精度保留
预计精度损失<5%,实际测试显示嵌入模型精度损失仅约0.7%
高效量化
使用GPTQ量化技术,结合Ultrachat、T2Ranking和COIG-CQIA作为校准集

模型能力

文本分类
文本重排序

使用案例

信息检索
搜索结果重排序
对搜索引擎返回的结果进行重新排序以提高相关性
文本处理
文档分类
对大量文档进行自动分类
AIbase
智启未来,您的人工智能解决方案智库
简体中文