D

Deepcoder 14B Preview GGUF

由 Mungert 开发
采用IQ-DynamicGate技术的超低位量化(1-2比特)模型,适用于内存受限设备和边缘计算场景
下载量 1,764
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

基于DeepSeek-R1蒸馏版Qwen-14B的文本生成模型,采用创新的IQ-DynamicGate量化技术,在保持极致内存效率的同时优化精度

模型特点

IQ-DynamicGate量化技术
采用分层特定策略的精度自适应量化,在1-2比特超低位量化下仍保持较高准确性
关键组件保护
嵌入层和输出层使用Q5_K保持精度,减少38%误差传播
混合量化策略
前25%和后25%层使用IQ4_XS,中间50%层使用IQ2_XXS/IQ3_S,实现效率与精度的平衡

模型能力

文本生成
低内存推理
边缘设备部署
量化研究

使用案例

内存受限部署
低显存GPU推理
在显存有限的GPU上运行大型语言模型
IQ1_M量化版本困惑度降低43.9%
边缘设备AI
在资源受限的边缘设备上部署语言模型
IQ3_XS版本仅需极低内存
研究应用
超低位量化研究
研究1-2比特量化的极限性能
IQ1_S在1比特下保持39.7%更好的准确率