Qwen_Qwen3-0.6B-GGUF开源模型-支持兼容处理免费部署使用

首页

Qwen Qwen3 0.6B GGUF

由 tensorblock 开发

本仓库包含Qwen/Qwen3-0.6B的GGUF格式模型文件，由TensorBlock提供的机器进行量化处理，兼容llama.cpp。

大型语言模型开源协议:Apache-2.0 #轻量级文本生成 #多语言支持 #低资源部署

下载量 905

发布时间 : 4/28/2025

模型简介

Qwen3-0.6B是一个0.6B参数规模的开源大语言模型，支持文本生成任务，采用GGUF格式量化处理，适用于本地部署和推理。

模型特点

多种量化选项

提供从Q2_K到Q8_0共12种不同量化级别的模型文件，满足不同场景下的性能和精度需求

兼容llama.cpp

所有模型文件兼容截至b5214提交版本的llama.cpp，便于本地部署和使用

轻量级部署

最小量化版本仅需0.347GB存储空间，适合资源受限环境

模型能力

文本生成

对话系统

内容创作

使用案例

对话系统

智能客服

部署为轻量级客服机器人

提供基本的问答和问题解决能力

内容创作

文本辅助创作

用于文章草稿生成和创意写作辅助

帮助快速生成初步内容框架

🚀 Qwen/Qwen3-0.6B - GGUF

本仓库包含 Qwen/Qwen3-0.6B 的 GGUF 格式模型文件。这些文件由 TensorBlock 提供的机器进行量化，并且与截至提交 b5214 的 llama.cpp 兼容。

反馈与支持：可通过 TensorBlock 的 Twitter/X、Telegram 群组和 Discord 服务器获取。

✨ 主要特性

本项目有以下两个主要项目：

项目	详情
Awesome MCP Servers	一个全面的模型上下文协议（MCP）服务器集合。
TensorBlock Studio	一个轻量级、开放且可扩展的多大语言模型交互工作室。

📚 详细文档

提示模板

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

模型文件规格

文件名	量化类型	文件大小	描述
Qwen3-0.6B-Q2_K.gguf	Q2_K	0.347 GB	最小，但有显著的质量损失，不建议用于大多数场景
Qwen3-0.6B-Q3_K_S.gguf	Q3_K_S	0.390 GB	非常小，但有较高的质量损失
Qwen3-0.6B-Q3_K_M.gguf	Q3_K_M	0.414 GB	非常小，但有较高的质量损失
Qwen3-0.6B-Q3_K_L.gguf	Q3_K_L	0.435 GB	小，有较大的质量损失
Qwen3-0.6B-Q4_0.gguf	Q4_0	0.469 GB	旧版本；小，有非常高的质量损失，建议使用 Q3_K_M
Qwen3-0.6B-Q4_K_S.gguf	Q4_K_S	0.471 GB	小，有较大的质量损失
Qwen3-0.6B-Q4_K_M.gguf	Q4_K_M	0.484 GB	中等，质量平衡，推荐使用
Qwen3-0.6B-Q5_0.gguf	Q5_0	0.544 GB	旧版本；中等，质量平衡，建议使用 Q4_K_M
Qwen3-0.6B-Q5_K_S.gguf	Q5_K_S	0.544 GB	大，质量损失低，推荐使用
Qwen3-0.6B-Q5_K_M.gguf	Q5_K_M	0.551 GB	大，质量损失非常低，推荐使用
Qwen3-0.6B-Q6_K.gguf	Q6_K	0.623 GB	非常大，质量损失极低
Qwen3-0.6B-Q8_0.gguf	Q8_0	0.805 GB	非常大，质量损失极低，不建议使用

📦 安装指南

命令行方式

首先，安装 Huggingface 客户端：

pip install -U "huggingface_hub[cli]"

然后，将单个模型文件下载到本地目录：

huggingface-cli download tensorblock/Qwen_Qwen3-0.6B-GGUF --include "Qwen3-0.6B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下载多个模型文件，可以尝试：

huggingface-cli download tensorblock/Qwen_Qwen3-0.6B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

📄 许可证

本项目采用 Apache-2.0 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文