D

Deepseek R1 Distill Qwen 32B 4bit

由 mlx-community 开发
这是DeepSeek-R1-Distill-Qwen-32B模型的MLX 4-bit量化版本,适用于苹果芯片设备的高效推理
下载量 130.79k
发布时间 : 1/21/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen-32B蒸馏优化的32B参数大语言模型,经过4-bit量化转换可在MLX框架下运行

模型特点

MLX优化
专为苹果芯片优化的4-bit量化版本,可在Mac设备高效运行
蒸馏模型
基于Qwen-32B的蒸馏版本,保持性能同时提升推理效率
中文优化
对中文文本处理进行了专门优化

模型能力

文本生成
对话交互
知识问答
文本摘要

使用案例

智能助手
聊天机器人
构建中文对话助手
流畅的中文对话体验
内容生成
文章创作
辅助进行中文内容创作
生成连贯的中文文本