QwQ-32B-GGUF开源文本生成模型 - 免费本地部署轻松完成文本创作

Qwq 32B GGUF

由 MaziyarPanahi 开发

QwQ-32B的GGUF格式量化版本，适用于本地文本生成任务。

下载量 459.38k

发布时间 : 3/6/2025

模型简介

该模型是Qwen/QwQ-32B的GGUF格式量化版本，支持多种量化级别（2位至8位），适用于本地部署的文本生成任务。

GGUF格式支持

采用最新的GGUF格式，替代不再受支持的GGML格式，兼容多种客户端和库。

多级量化

提供从2位到8位的多种量化级别，满足不同硬件条件下的部署需求。

广泛兼容性

支持多种客户端和库，包括llama.cpp、LM Studio、text-generation-webui等。

文本生成

本地推理

文本生成

创意写作

用于生成故事、诗歌等创意文本内容。

对话系统

可用于构建本地部署的聊天机器人。

QwQ-32B-GGUF 项目提供了 Qwen/QwQ-32B 模型的 GGUF 格式文件，方便用户进行文本生成任务。

本项目提供了 Qwen/QwQ-32B 模型的 GGUF 格式文件。你可以使用支持 GGUF 格式的客户端或库来加载和使用这些模型文件。

GGUF 是 llama.cpp 团队在 2023 年 8 月 21 日推出的新格式，用于替代不再受 llama.cpp 支持的 GGML 格式。

以下是已知支持 GGUF 的客户端和库的不完全列表：

llama.cpp：GGUF 的源项目，提供命令行界面和服务器选项。
llama-cpp-python：一个支持 GPU 加速、LangChain 集成和 OpenAI 兼容 API 服务器的 Python 库。
LM Studio：一款适用于 Windows 和 macOS（Silicon）的易用且强大的本地图形界面工具，支持 GPU 加速。截至 2023 年 11 月 27 日，Linux 版本处于测试阶段。
text-generation-webui：最广泛使用的网页界面，具有许多功能和强大的扩展，支持 GPU 加速。
KoboldCpp：一个功能齐全的网页界面，支持所有平台和 GPU 架构的 GPU 加速，尤其适合故事创作。
GPT4All：一个免费开源的本地运行图形界面，支持 Windows、Linux 和 macOS，具备完整的 GPU 加速功能。
LoLLMS Web UI：一个很棒的网页界面，具有许多有趣和独特的功能，包括一个完整的模型库，便于模型选择。
Faraday.dev：一款美观易用的基于角色的聊天图形界面，适用于 Windows 和 macOS（Silicon 和 Intel），支持 GPU 加速。
candle：一个专注于性能的 Rust 机器学习框架，包括 GPU 支持，易于使用。
ctransformers：一个支持 GPU 加速、LangChain 集成和 OpenAI 兼容 AI 服务器的 Python 库。截至编写本文时（2023 年 11 月 27 日），ctransformers 已有很长时间未更新，不支持许多最新模型。