Qwen3-8B-GGUF开源大语言模型 - 支持超长上下文与多语言处理

首页

Qwen3 8B GGUF

由 lmstudio-community 开发

Qwen团队推出的8B参数规模大语言模型，支持超长上下文和多种语言处理

大型语言模型开源协议:Apache-2.0 #超长上下文推理 #多模态指令跟随 #数学编程增强

下载量 39.45k

发布时间 : 4/28/2025

模型简介

基于Qwen3架构的8B参数规模大语言模型，擅长创意写作、角色扮演和多轮对话，具备高级智能体能力和多语言支持

模型特点

超长上下文支持

支持最长131,072 tokens的上下文处理（默认32k），采用YaRN技术

双模式推理

兼具思维链推理与直出模式，可通过/no_think指令切换

多领域增强

数学、编程与常识推理能力经过特别优化

多语言支持

支持超过100种语言与方言处理

模型能力

文本生成

创意写作

角色扮演

多轮对话

指令跟随

数学推理

编程辅助

常识推理

使用案例

内容创作

创意写作

生成小说、诗歌等创意文本

可产生富有想象力的文学内容

角色扮演

模拟不同角色的对话交互

能维持连贯的角色设定和对话

技术应用

编程辅助

代码生成与解释

支持多种编程语言的代码处理

数学推理

解决数学问题和逻辑推理

能处理复杂数学计算和证明

🚀 Qwen3 8B量化模型

该模型是LM Studio社区模型亮点计划的一部分，旨在展示社区中新颖且值得关注的模型。快来Discord参与讨论吧！

模型信息

属性	详情
量化者	bartowski
任务类型	文本生成
许可证	apache - 2.0
基础模型	Qwen/Qwen3 - 8B
基础模型关系	量化版本

模型创建者

Qwen

原始模型

Qwen3 - 8B

GGUF量化

由bartowski基于llama.cpp的b5200版本提供。

🔧 技术细节

上下文长度：借助YaRN技术，支持最长达131,072个标记的上下文长度（默认32k）。
禁用推理：支持使用/no_think来禁用推理功能，只需将其添加到提示词末尾即可。
推理模式：支持思考和非思考两种模式，且在两种模式下都增强了推理能力，在数学、编码和常识推理方面表现显著提升。
应用场景：在创意写作、角色扮演、多轮对话和指令遵循等方面表现出色。
语言支持：具备先进的智能体能力，支持超过100种语言和方言。

👏 特别感谢

特别感谢Georgi Gerganov以及llama.cpp的整个开发团队，是他们让这一切成为可能。

⚠️ 免责声明

LM Studio并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。您需明白，社区模型生成的内容可能具有冒犯性、有害性、不准确性或其他不当性，甚至具有欺骗性。每个社区模型的唯一责任在于发起该模型的个人或实体。LM Studio可能不会监控或控制社区模型，也不能且不会对任何此类模型负责。LM Studio对社区模型的准确性、可靠性或益处不做任何保证。此外，LM Studio不保证社区模型能满足您的需求，也不保证其安全性、连续性、随时可用性、无错误、无病毒，或能修复任何错误等。您需独自承担因使用或访问社区模型、下载任何社区模型，或使用LM Studio提供或通过其提供的任何其他社区模型而导致的任何损失。