Q

Qwen3 8B

由 Qwen 开发
Qwen3是通义千问系列大语言模型的最新8B参数版本,支持思维模式与非思维模式无缝切换,具备强大的推理、指令遵循和智能体能力。
下载量 550.09k
发布时间 : 4/27/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-8B是一个8.2B参数的因果语言模型,支持复杂逻辑推理、数学计算、编程和多语言处理,适用于各类自然语言处理任务。

模型特点

思维/非思维模式切换
支持通过enable_thinking参数或/think、/no_think指令动态切换模式,优化不同场景下的表现
增强推理能力
在数学、代码生成和常识逻辑推理方面显著超越前代模型
智能体能力
精准对接外部工具,在开源模型中实现复杂智能体任务的领先性能
长文本处理
原生支持32,768 tokens上下文,通过YaRN扩展至131,072 tokens

模型能力

文本生成
复杂逻辑推理
数学计算
代码生成
多语言处理
工具调用
创意写作
角色扮演

使用案例

智能对话
多轮对话
支持自然流畅的多轮对话交互
提供更自然、引人入胜的对话体验
编程辅助
代码生成
根据自然语言描述生成代码
在代码生成任务中表现优异
教育
数学问题解答
解决复杂数学问题并展示推理过程
在数学推理任务中超越前代模型