D

Deepseek R1 Quantized.w4a16

由 RedHatAI 开发
DeepSeek-R1的INT4权重量化版本,通过减少权重位数降低GPU内存和磁盘空间需求约50%,保持原始模型性能。
下载量 119
发布时间 : 4/17/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于DeepSeek-R1的权重量化版本,将权重从8位减少到4位,显著降低了资源需求,同时保持了原始模型的性能。适用于需要高效部署的大型语言模型应用场景。

模型特点

INT4权重量化
将权重从8位减少到4位,降低GPU内存和磁盘空间需求约50%
高效部署
支持使用vLLM后端高效部署,适合大规模生产环境
性能保留
在量化后仍保持接近原始模型的性能表现

模型能力

文本生成
语言理解
推理任务处理

使用案例

教育
数学问题解答
解答复杂数学问题
在MATH-500测试中达到97.08%的准确率
专业测试
AIME测试
处理美国数学邀请赛级别的问题
在AIME 2024测试中达到77.00%的准确率
通用知识问答
MMLU测试
处理多学科多项选择题
在MMLU测试中达到86.99%的准确率