D

Deepseek V3 0324 GGUF

由 ubergarm 开发
当前V3-0324模型在该尺寸类别中表现最佳的量化版本,在保持性能接近Q8_0的同时显著减小了体积
下载量 1,712
发布时间 : 3/26/2025
模型介绍
内容详情
替代品

模型简介

高性能量化语言模型,支持32k长上下文处理,专为GPU显存优化设计

模型特点

高效显存利用
采用MLA技术实现显存优化,32k上下文可在24GB显存内运行
高质量量化
使用新一代重要性矩阵和IQx_K_R4量化技术,保持接近原始模型的性能
模块化量化策略
对不同层(词嵌入/注意力/专家层)采用差异化量化方案

模型能力

长文本生成
代码理解与生成
多语言处理

使用案例

文本处理
长文档摘要
处理长达32k token的文档并生成摘要
代码辅助
代码补全
基于上下文生成代码建议