Q

Qwen3 235B A22B GPTQ Int4

由 Qwen 开发
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。基于广泛的训练,Qwen3在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。
下载量 1,563
发布时间 : 5/10/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-235B-A22B是一个2350亿参数的大语言模型,采用混合专家架构(MoE),激活参数220亿。支持在思维模式和非思维模式间切换,具备强大的推理、多语言和工具调用能力。

模型特点

思维模式切换
支持在思维模式(用于复杂推理、数学和编码)和非思维模式(用于高效通用对话)间无缝切换
增强推理能力
在数学、代码生成和常识逻辑推理方面表现优异,超越前代模型
人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,提供更自然的对话体验
强大代理能力
能够精确集成外部工具,在复杂代理任务中达到开源模型领先性能
多语言支持
支持100多种语言和方言,具备强大的多语言指令遵循和翻译能力

模型能力

文本生成
复杂推理
数学计算
代码生成
多语言翻译
工具调用
长文本处理

使用案例

智能对话
多轮对话
进行自然流畅的多轮对话
提供沉浸式对话体验
角色扮演
模拟不同角色的对话风格
实现生动的角色互动
代码辅助
代码生成
根据需求生成代码片段
提高开发效率
代码解释
解释复杂代码的功能
帮助理解代码逻辑
数学推理
数学问题求解
解决复杂的数学问题
提供详细解题步骤