O

Olympiccoder 32B GGUF

由 Mungert 开发
OlympicCoder-32B是基于Qwen2.5-Coder-32B-Instruct的代码生成模型,采用IQ-DynamicGate超低位量化技术,适用于内存受限环境下的高效推理。
下载量 361
发布时间 : 3/31/2025
模型介绍
内容详情
替代品

模型简介

该模型专注于代码生成任务,采用创新的1-2比特量化方法,在保持高精度的同时显著减少内存占用,适合部署在CPU和边缘设备上。

模型特点

IQ-DynamicGate超低位量化
采用1-2比特精度自适应量化技术,在Llama-3-8B上验证可降低困惑度达43.9%
分层量化策略
前25%和后25%层使用IQ4_XS,中间50%层使用IQ2_XXS/IQ3_S,关键组件保持Q5_K精度
内存高效
量化版本内存占用最低仅2.1GB,适合边缘设备和低显存GPU部署
多格式支持
提供BF16、F16及多种量化格式(Q4_K至Q8_0),适应不同硬件需求

模型能力

代码生成
低资源环境推理
多精度量化推理

使用案例

开发工具
代码补全
在内存受限的IDE插件中提供智能代码补全功能
在CPU设备上实现低延迟响应
边缘计算
设备端代码生成
在树莓派等边缘设备上运行代码生成服务
内存占用降低60%以上