D

Deepseek R1 Distill Qwen 14B Quantized.w8a8

由 neuralmagic 开发
DeepSeek-R1-Distill-Qwen-14B的量化版本,通过INT8量化优化了权重和激活,降低了GPU内存需求并提高了计算效率。
下载量 765
发布时间 : 2/4/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于DeepSeek-R1-Distill-Qwen-14B的量化版本,通过INT8量化技术优化了权重和激活,显著降低了GPU内存需求并提高了计算吞吐量。适用于文本生成任务。

模型特点

INT8量化
通过INT8量化技术优化权重和激活,显著降低GPU内存需求和磁盘空间占用。
高效推理
使用vLLM后端部署,支持高效的文本生成任务。
高性能恢复率
在多个评估任务中保持了原始模型99%以上的性能恢复率。

模型能力

文本生成
对话系统
代码生成

使用案例

对话系统
智能客服
用于构建高效的智能客服系统,提供自然流畅的对话体验。
在对话任务中保持了原始模型99%以上的性能。
代码生成
代码补全
用于代码补全和生成任务,提高开发效率。
在HumanEval评估中保持了99.4%的性能恢复率。