Q

Qwen3 235B A22B 128K GGUF

由 unsloth 开发
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密和混合专家(MoE)模型套件。基于大规模训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。
下载量 310.66k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-235B-A22B是通义千问系列的大规模语言模型,具有235B参数和22B激活参数,支持思维模式和非思维模式切换,适用于复杂推理和高效对话场景。

模型特点

思维模式切换
支持单模型内无缝切换思维模式(用于复杂逻辑推理)和非思维模式(用于高效通用对话)
增强推理能力
在数学、代码生成和常识逻辑推理方面超越前代模型
人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现优异
智能体能力
支持精确集成外部工具,在复杂智能体任务中达到开源模型领先水平
多语言支持
支持100+种语言和方言,具备多语言指令遵循和翻译的强大能力

模型能力

文本生成
多轮对话
代码生成
数学推理
多语言翻译
智能体任务执行
创意写作
角色扮演

使用案例

教育
数学问题解答
帮助学生解决复杂数学问题并展示推理过程
提高学习效率和理解深度
软件开发
代码生成与调试
根据需求生成代码并帮助开发者调试
加速开发流程
客户服务
多语言客服
提供多语言的客户服务对话
提升客户满意度