Q

Qwen3 0.6B Unsloth Bnb 4bit

由 unsloth 开发
Qwen3是Qwen系列最新一代的大语言模型,提供了一套全面的密集和混合专家(MoE)模型。基于广泛的训练,Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。
下载量 50.36k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-0.6B是一个0.6B参数的因果语言模型,支持在思考和非思考模式之间切换,适用于复杂逻辑推理、数学和编码任务,以及高效通用对话。

模型特点

思考与非思考模式切换
支持在单一模型中无缝切换思考模式(用于复杂逻辑推理、数学和编码)和非思考模式(用于高效通用对话)。
增强推理能力
在数学、代码生成和常识逻辑推理方面超越了之前的QwQ和Qwen2.5指令模型。
人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,提供更自然、吸引人和沉浸式的对话体验。
代理能力
能够在思考和非思考模式下精确集成外部工具,并在基于代理的复杂任务中实现开源模型的领先性能。
多语言支持
支持100多种语言和方言,具有强大的多语言指令遵循和翻译能力。

模型能力

文本生成
复杂逻辑推理
数学计算
代码生成
多轮对话
指令遵循
多语言翻译
工具调用

使用案例

教育与学习
数学问题解答
解答复杂的数学问题,提供逐步推理过程。
在数学推理任务中表现优异。
编程学习辅助
生成代码示例,解释编程概念。
能够生成高质量的代码和解释。
创意写作
故事生成
根据提示生成创意故事。
生成的故事具有吸引力和连贯性。
角色扮演
模拟不同角色的对话。
提供沉浸式的对话体验。
商业应用
客户服务
处理客户查询,提供支持。
能够理解并准确回答客户问题。
文档生成
根据指令生成商业文档。
生成的文档结构清晰,内容准确。