E

EXAONE Deep 32B GGUF

由 Mungert 开发
EXAONE-Deep-32B是一个32B参数的大语言模型,支持英语和韩语,专为文本生成任务设计。
下载量 2,249
发布时间 : 3/25/2025
模型介绍
内容详情
替代品

模型简介

该模型基于LGAI-EXAONE/EXAONE-3.5-32B-Instruct微调,采用IQ-DynamicGate超低位量化技术,优化了内存效率和推理速度。

模型特点

IQ-DynamicGate超低位量化
采用精度自适应量化技术,在1-2比特量化下显著提升模型准确性,同时保持高内存效率。
动态精度分配
前25%和后25%的层使用IQ4_XS,中间50%的层使用IQ2_XXS/IQ3_S,优化了模型性能。
关键组件保护
嵌入层和输出层使用Q5_K量化,减少错误传播,提升模型整体准确性。

模型能力

文本生成
多语言支持(英语、韩语)
超低位量化推理

使用案例

内存受限环境
GPU显存适配
在显存有限的GPU上运行大型语言模型。
通过量化技术,模型显存占用大幅降低。
CPU和边缘设备部署
在低功耗设备上运行模型。
超低位量化使得模型可以在资源受限的设备上运行。
研究与应用
超低位量化研究
研究1-2比特量化对模型性能的影响。
DynamicGate量化技术显著提升了低位量化的模型准确性。