Q

Qwen3 8B AWQ

由 Qwen 开发
Qwen3-8B-AWQ是通义千问系列最新一代8.2B参数的大语言模型,采用AWQ 4-bit量化技术优化推理效率。支持思维与非思维模式切换,具备卓越的推理、指令遵循和智能体能力。
下载量 13.99k
发布时间 : 5/3/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen3-8B的4-bit量化版本,在保持模型性能的同时显著降低计算资源需求。支持32K上下文长度,可通过YaRN扩展至131K tokens。

模型特点

双模式动态切换
支持思维模式(复杂推理)与非思维模式(高效对话)无缝切换,通过enable_thinking参数或/think、/no_think指令控制
增强推理能力
在数学、代码生成和逻辑推理方面超越前代模型,思维模式下使用特殊解码策略提升性能
高效量化
采用AWQ 4-bit量化技术,在保持模型精度的同时减少75%显存占用
超长上下文
原生支持32K tokens,通过YaRN技术可扩展至131K tokens长文本处理

模型能力

复杂逻辑推理
多轮对话
代码生成
多语言翻译
工具调用
创意写作
数学计算

使用案例

智能助手
个性化对话
通过思维模式实现深度推理对话,或非思维模式进行高效日常交流
更自然的交互体验,响应速度提升40%
开发辅助
代码补全
利用增强的代码理解能力生成高质量代码片段
在HumanEval基准测试中达到开源模型领先水平
数据分析
长文档处理
结合YaRN技术分析超长技术文档或法律文本
支持131K tokens上下文理解