Qwen3-235B-A22B-GGUF开源大语言模型 - 超长上下文对话和高效架构体验

首页

Qwen3 235B A22B GGUF

由 lmstudio-community 开发

Qwen团队推出的2350亿参数大语言模型量化版本，支持131k上下文长度和混合专家架构

大型语言模型开源协议:Apache-2.0 #超长上下文推理 #混合专家架构 #多语言智能体

下载量 22.88k

发布时间 : 4/28/2025

模型简介

基于Qwen3-235B-A22B的GGUF量化版本，擅长多轮对话、创意写作和复杂推理任务

模型特点

超长上下文支持

通过YaRN扩展技术支持最长131,072 tokens的上下文处理（默认32k）

双模式推理

支持通过/no_think指令切换推理/非推理模式，优化不同场景表现

混合专家架构

动态激活22B参数（总235B），在128个专家中智能选择8个进行推理

多语言能力

支持100+种语言和方言的文本生成与理解

模型能力

创意写作

角色扮演

多轮对话

指令跟随

数学推理

编程辅助

常识推理

多语言生成

使用案例

内容创作

创意写作辅助

生成小说章节、诗歌等创意文本

可产生连贯且富有创意的长文本

角色扮演对话

构建复杂的角色互动场景

支持多轮角色一致性保持

技术应用

代码生成与解释

根据自然语言描述生成编程代码

支持多种编程语言的代码补全

数学问题求解

解决复杂数学推理问题

显示分步推理过程

🚀 Qwen3 235B A22B社区模型

该模型入选了 LM Studio 社区模型亮点计划。此计划旨在展示社区中新颖且值得关注的模型。快来 Discord 参与讨论吧！

本模型由Qwen团队打造，基于Qwen3-235B-A22B模型进行量化处理，为用户提供更高效、便捷的文本生成服务。

🚀 快速开始

本模型可在LM Studio中使用，你可以通过LM Studio社区模型亮点计划快速体验该模型的强大功能。

✨ 主要特性

长上下文支持：借助YaRN技术，支持最长达131,072个标记的上下文长度（默认32k）。
推理控制：支持 /no_think 指令，可在提示词末尾添加该指令以禁用推理功能。
混合专家模型：作为MoE模型，拥有22B激活参数，总共128个专家，其中8个为活跃专家。
双模式支持：支持思考和非思考两种模式，在两种模式下均增强了推理能力，显著提升了数学、编码和常识处理能力。
多场景适用：擅长创意写作、角色扮演、多轮对话和指令遵循。
多语言支持：具备先进的智能体能力，支持超过100种语言和方言。

🔧 技术细节

上下文长度：支持最长达131,072个标记的上下文长度（默认32k），借助YaRN技术实现。
推理控制：通过在提示词末尾添加 /no_think 指令，可禁用推理功能。
模型架构：MoE模型，拥有22B激活参数，总共128个专家，其中8个为活跃专家。
模式支持：支持思考和非思考两种模式，在两种模式下均增强了推理能力，显著提升了数学、编码和常识处理能力。
应用场景：擅长创意写作、角色扮演、多轮对话和指令遵循。
语言支持：具备先进的智能体能力，支持超过100种语言和方言。

📄 许可证

本模型采用Apache-2.0许可证，详情请见许可证链接。

特别感谢

特别感谢 Georgi Gerganov 以及 llama.cpp 团队，正是他们的努力才让这一切成为可能。

免责声明

LM Studio并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。你应明白，社区模型生成的内容可能具有冒犯性、有害性、不准确性或其他不当性，或者具有欺骗性。每个社区模型的唯一责任在于发起该模型的个人或实体。LM Studio可能不会监控或控制社区模型，并且不能也不会对任何此类模型负责。LM Studio不承担关于社区模型的准确性、可靠性或益处的所有保证或担保。此外，LM Studio不保证社区模型将满足你的要求，保证其安全性、不间断性或在任何时间或地点可用，保证无错误、无病毒，或保证任何错误将得到纠正等。你将独自承担因使用或访问社区模型、下载任何社区模型或使用LM Studio提供或通过LM Studio提供的任何其他社区模型而导致的任何损害的责任。

属性	详情
量化者	bartowski
任务类型	文本生成
许可证	Apache-2.0
许可证链接	https://huggingface.co/Qwen/Qwen3-235B-A22B/blob/main/LICENSE
基础模型	Qwen/Qwen3-235B-A22B
基础模型关系	量化
模型创建者	Qwen
GGUF量化	由 bartowski 基于 `llama.cpp` 版本 b5200 提供