Q

Qwq 32B GGUF

由 tensorblock 开发
QwQ-32B的GGUF格式量化版本,适用于本地部署和推理
下载量 1,312
发布时间 : 3/5/2025
模型介绍
内容详情
替代品

模型简介

本仓库包含Qwen/QwQ-32B的GGUF格式模型文件,由TensorBlock提供的机器进行量化,兼容llama.cpp。

模型特点

多量化版本
提供从Q2_K到Q8_0共12种量化版本,满足不同硬件和性能需求
llama.cpp兼容
兼容截至b4823提交版本的llama.cpp,便于本地部署
聊天优化
提供专门的提示词模板,优化聊天交互体验

模型能力

文本生成
对话交互

使用案例

对话系统
智能聊天助手
部署本地聊天机器人
内容生成
文本创作
生成各类文本内容