D

Deepseek R1 GGUF

由 unsloth 开发
DeepSeek-R1是由Unsloth优化的1.58-bit动态量化大语言模型,采用MoE架构,支持英语任务处理
下载量 2.0M
发布时间 : 1/20/2025

模型简介

基于DeepSeek-R1的量化版本,通过Unsloth的1.58-bit + 2-bit动态量化技术实现高效推理,特别优化了MoE层量化策略

模型特点

动态混合量化
采用1.58-bit + 2-bit动态量化技术,对MoE层进行选择性量化,精度优于标准1-bit/2-bit方案
多版本量化支持
提供1.58bit到2.51bit四种量化方案,平衡磁盘占用与推理精度
GPU加速优化
支持通过llama.cpp进行GPU层卸载,在RTX 4090等设备上实现加速推理

模型能力

英语文本生成
指令跟随
代码理解与生成

使用案例

开发辅助
代码生成
根据自然语言描述生成Python等编程语言代码
示例展示Flappy Bird游戏实现代码生成能力
内容创作
技术文档翻译
中英技术文档的互译处理
支持通过特定提示模板实现结构化翻译
AIbase
智启未来,您的人工智能解决方案智库
简体中文