Q

Qwen3 235B A22B

由 unsloth 开发
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。基于广泛的训练,Qwen3 在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。
下载量 421
发布时间 : 5/9/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-235B-A22B 是一个具有 235B 参数和 22B 激活参数的混合专家(MoE)模型,支持 100 多种语言,具备强大的推理、指令遵循和代理能力。

模型特点

思维与非思维模式切换
支持在单个模型内无缝切换思维模式(用于复杂的逻辑推理、数学和编码)和非思维模式(用于高效的通用对话)。
增强的推理能力
在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ 和 Qwen2.5 指令模型。
卓越的人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,提供更自然、引人入胜和沉浸式的对话体验。
专业的代理能力
能够在思维和非思维模式下精确集成外部工具,并在复杂的基于代理的任务中实现领先性能。
多语言支持
支持 100 多种语言和方言,具备强大的多语言指令遵循和翻译能力。

模型能力

文本生成
逻辑推理
数学计算
代码生成
多语言翻译
工具调用
多轮对话

使用案例

教育
数学问题解答
帮助学生解决复杂的数学问题,提供逐步推理过程。
提高学生的数学理解和解题能力。
编程
代码生成
根据用户需求生成高质量的代码片段或完整程序。
提高开发效率,减少编码错误。
客户服务
多语言客服
提供多语言的客户支持,理解并回答客户问题。
提升客户满意度,降低语言障碍。