Q

Qwen3 30B A3B Quantized.w4a16

由 RedHatAI 开发
Qwen3-30B-A3B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能。
下载量 379
发布时间 : 5/6/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen3-30B-A3B的量化模型,适用于推理、函数调用、多语言指令遵循和翻译任务。

模型特点

高效权重量化
采用INT4量化方案,减少75%的磁盘和GPU内存需求。
高性能推理
在多个基准测试中保持接近原始模型的性能,恢复率达98%以上。
多语言支持
支持多语言指令遵循和翻译任务。
优化部署
支持vLLM后端高效部署,兼容OpenAI服务。

模型能力

文本生成
函数调用
多语言指令遵循
翻译

使用案例

自然语言处理
多语言翻译
支持多种语言之间的高质量翻译。
指令遵循
能够理解和执行复杂的多语言指令。
推理任务
数学推理
在数学推理任务中表现优异。
GSM-8K任务中达到86.66分
逻辑推理
在逻辑推理任务中保持高性能。
ARC Challenge任务中达到62.97分