Qwen3是通义千问系列最新一代大语言模型,提供完整稠密模型与混合专家(MoE)架构。经过海量训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。
下载量 2,511
发布时间 : 5/5/2025
模型简介
Qwen3-0.6B是一个0.6B参数的因果语言模型,支持文本生成任务,具备强大的推理、指令遵循和多语言能力。
模型特点
独创思维模式切换
支持在思维模式(复杂逻辑推理/数学/编程)与非思维模式(高效通用对话)间无缝切换,确保各类场景最优表现。
显著增强推理能力
在数学、代码生成和常识逻辑推理方面,超越前代QwQ(思维模式)与Qwen2.5指令模型(非思维模式)。
卓越的人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现优异,提供更自然、沉浸的对话体验。
专业智能体能力
精准对接外部工具(思维/非思维模式皆可),在复杂智能体任务中保持开源模型领先性能。
多语言支持
支持100+种语言与方言,具备强大的多语言指令遵循与翻译能力。
模型能力
文本生成
复杂逻辑推理
数学计算
代码生成
多轮对话
多语言翻译
智能体任务处理
使用案例
教育与学习
数学问题解答
解决复杂的数学问题,提供逐步推理过程。
准确解答数学问题,包括最终答案和推理步骤。
编程辅助
代码生成
根据用户需求生成代码片段或完整程序。
生成符合需求的代码,提高开发效率。
创意写作
故事创作
根据用户提示生成创意故事或文章。
生成富有创意的文本内容,提供沉浸式阅读体验。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文