Qwen3-4B-GGUF开源大语言模型 - 长上下文支持创意写作与多轮对话

首页

Qwen3 4B GGUF

由 lmstudio-community 开发

Qwen3-4B是由Qwen开发的大语言模型，支持131,072 tokens的上下文长度，擅长创意写作、角色扮演和多轮对话。

大型语言模型 #超长上下文 #多语言智能体 #指令双模式

下载量 26.16k

发布时间 : 4/28/2025

模型简介

Qwen3-4B是一个高性能的大语言模型，具备高级智能体能力，支持100+种语言与方言，擅长创意写作、角色扮演、多轮对话及指令跟随。

模型特点

长上下文支持

支持最长131,072 tokens的上下文（YaRN默认32k）。

双模式支持

支持思考/非思考双模式，增强数学、编程与常识推理能力。

高级智能体能力

具备高级智能体能力，支持100+种语言与方言。

禁用推理指令

支持`/no_think`指令禁用推理（只需在提示词末尾添加）。

模型能力

创意写作

角色扮演

多轮对话

指令跟随

数学推理

编程推理

常识推理

使用案例

创意写作

故事生成

生成连贯且富有创意的故事内容。

角色扮演

虚拟角色对话

模拟不同角色的对话行为。

编程辅助

代码生成

根据需求生成代码片段。

🚀 社区模型：Qwen出品的Qwen3 4B

这是 LM Studio 社区模型亮点计划。该计划旨在突出社区中的新模型和值得关注的模型。快来 Discord 参与讨论吧！

🚀 快速开始

本模型是Qwen3 4B的量化版本，由bartowski基于llama.cpp的b5200版本进行量化。以下是模型的相关信息：

属性	详情
量化者	bartowski
模型类型	文本生成
基础模型	Qwen/Qwen3-4B
基础模型关系	量化版本

✨ 主要特性

模型创建者：Qwen
原始模型：Qwen3-4B
GGUF量化：由 bartowski 基于 llama.cpp 的 b5200 版本提供

🔧 技术细节

上下文长度：使用YaRN技术时，支持最长达131,072个标记的上下文长度（默认32k）。
禁用推理：支持 /no_think 指令，只需将其添加到提示词末尾，即可禁用推理功能。
双模式支持：支持思考和非思考两种模式，且在两种模式下均增强了推理能力，显著提升了数学、编码和常识推理的表现。
多场景擅长：在创意写作、角色扮演、多轮对话和指令遵循方面表现出色。
多语言支持：具备高级智能体能力，支持超过100种语言和方言。

🌟 特别感谢

特别感谢 Georgi Gerganov 以及整个 llama.cpp 团队，是他们让这一切成为可能。

⚠️ 免责声明

LM Studio并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。您应明白，社区模型生成的内容可能具有冒犯性、有害性、不准确性或其他不当性，甚至具有欺骗性。每个社区模型的唯一责任由发起该模型的个人或实体承担。LM Studio可能不会监控或控制社区模型，也不能且不会对任何此类模型负责。LM Studio对社区模型的准确性、可靠性或益处不做任何保证。此外，LM Studio不保证社区模型能满足您的需求，也不保证其安全性、连续性、随时可用性，或无错误、无病毒，也不保证会纠正任何错误等。您将独自承担因使用或访问社区模型、下载任何社区模型或使用LM Studio提供或通过LM Studio提供的任何其他社区模型而导致的任何损失。