QwQ-32B-GGUF开源模型 - 适用于本地免费部署与推理的实用工具

Qwq 32B GGUF

由 tensorblock 开发

QwQ-32B的GGUF格式量化版本，适用于本地部署和推理

下载量 1,312

发布时间 : 3/5/2025

模型简介

本仓库包含Qwen/QwQ-32B的GGUF格式模型文件，由TensorBlock提供的机器进行量化，兼容llama.cpp。

多量化版本

提供从Q2_K到Q8_0共12种量化版本，满足不同硬件和性能需求

llama.cpp兼容

兼容截至b4823提交版本的llama.cpp，便于本地部署

聊天优化

提供专门的提示词模板，优化聊天交互体验

文本生成

对话交互

对话系统

智能聊天助手

部署本地聊天机器人

内容生成

文本创作

生成各类文本内容

本仓库包含 Qwen/QwQ-32B 的 GGUF 格式模型文件。这些文件由 TensorBlock 提供的机器进行量化，并且与截至提交 b4823 的 llama.cpp 兼容。

反馈与支持：可通过 TensorBlock 的 Twitter/X、Telegram 群组和 Discord 服务器获取。

项目名称	项目介绍	项目图片	项目链接
Awesome MCP Servers	一个全面的模型上下文协议（MCP）服务器集合。		查看项目
TensorBlock Studio	一个轻量级、开放且可扩展的多大语言模型交互工作室。		查看项目

首先，安装 Huggingface 客户端：

pip install -U "huggingface_hub[cli]"

然后，将单个模型文件下载到本地目录：

huggingface-cli download tensorblock/QwQ-32B-GGUF --include "QwQ-32B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下载多个模型文件，可以尝试：

huggingface-cli download tensorblock/QwQ-32B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant
<think>