Q

Qwen3 32B GPTQ Int4

由 JunHowie 开发
Qwen3是通义千问系列大语言模型的最新8B参数版本,支持思维模式切换、多语言处理和工具调用,具备强大的推理和对话能力。
下载量 1,079
发布时间 : 4/29/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-8B是一个8.2B参数的因果语言模型,支持思维与非思维模式动态切换,擅长复杂推理、代码生成和多语言任务,原生支持32K上下文并可通过YaRN扩展至131K。

模型特点

动态思维模式切换
首创支持在思维模式(处理复杂推理)与非思维模式(高效对话)间动态切换,通过<think>标签显式输出推理过程
增强推理能力
在数学、代码生成和逻辑推理任务上超越前代模型,思维模式下推理性能接近QwQ-32B
多语言支持
支持100+种语言与方言的指令理解和翻译任务
长上下文处理
原生支持32,768 tokens上下文,通过YaRN技术可扩展至131,072 tokens

模型能力

复杂逻辑推理
数学问题求解
多轮对话
创意写作
角色扮演
代码生成与解释
多语言翻译
工具调用

使用案例

智能助手
多轮对话系统
构建能理解上下文、支持思维显式化的对话机器人
提供更自然、沉浸式的对话体验
开发者工具
代码生成与补全
辅助开发者编写和优化代码
在开源模型代码任务中表现领先