Q

Qwen3 1.7B GGUF

由 Qwen 开发
通义千问系列大语言模型的最新版本,支持思维与非思维模式切换,具备强大的推理、多语言和智能体能力。
下载量 1,180
发布时间 : 5/5/2025
模型介绍
内容详情
替代品

模型简介

Qwen3是通义千问系列大语言模型的最新版本,提供全系列稠密与混合专家(MoE)模型。基于大规模训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

模型特点

思维与非思维模式切换
独家支持思维模式(适用于复杂逻辑推理、数学与代码)与非思维模式(适用于高效通用对话)的单模型无缝切换,确保各类场景下的最优表现。
增强的推理能力
在数学、代码生成和常识逻辑推理任务上超越前代QwQ(思维模式)与Qwen2.5指令模型(非思维模式)。
人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现优异,提供更自然、生动且沉浸式的对话体验。
智能体能力
可在思维与非思维模式下精准整合外部工具,在开源模型的复杂智能体任务中保持领先性能。
多语言支持
支持100+种语言与方言,具备强大的多语言指令遵循与翻译能力。

模型能力

文本生成
复杂逻辑推理
数学计算
代码生成
多语言翻译
智能体任务执行
多轮对话
创意写作
角色扮演

使用案例

教育与研究
数学问题解答
解决复杂的数学问题,提供逐步推理过程。
在数学推理任务上表现优异,超越前代模型。
编程辅助
生成代码片段或解决编程问题。
在代码生成任务上表现优异,超越前代模型。
创意与娱乐
创意写作
生成故事、诗歌或其他创意文本。
提供更自然、生动且沉浸式的创意写作体验。
角色扮演
模拟不同角色的对话和行为。
在多轮对话和角色扮演方面表现优异。
商业与工具
多语言翻译
支持100+种语言与方言的翻译任务。
具备强大的多语言指令遵循与翻译能力。
智能体任务
整合外部工具执行复杂任务。
在开源模型的复杂智能体任务中保持领先性能。