E

EXAONE Deep 7.8B GGUF

由 Mungert 开发
采用IQ-DynamicGate技术的超低位量化(1-2比特)的7.8B参数模型,支持英语和韩语文本生成任务。
下载量 1,791
发布时间 : 3/19/2025
模型介绍
内容详情
替代品

模型简介

EXAONE-Deep-7.8B是一个基于LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct微调的模型,采用创新的IQ-DynamicGate技术进行超低位量化,适用于内存受限的部署环境和边缘设备。

模型特点

IQ-DynamicGate技术
采用精度自适应量化技术,在超低位模型(1-2比特)中显著提升性能。
动态精度分配
前25%和后25%的层使用IQ4_XS,中间50%的层使用IQ2_XXS/IQ3_S,优化效率和精度。
关键组件保护
嵌入层和输出层使用Q5_K,减少38%的误差传播。
极致内存效率
适用于内存受限的部署环境,支持CPU和边缘设备。

模型能力

文本生成
多语言支持(英语、韩语)
超低位量化推理

使用案例

内存受限的部署环境
边缘设备推理
在内存有限的边缘设备上运行文本生成任务。
显著降低内存占用,保持合理精度。
研究与应用
超低位量化研究
探索1-2比特量化技术在大型语言模型中的应用。
提供量化性能对比数据,支持研究需求。