通义千问系列大语言模型的最新版本,支持思维与非思维模式切换,具备强大的推理、多语言和智能体能力。
下载量 1,180
发布时间 : 5/5/2025
模型简介
Qwen3是通义千问系列大语言模型的最新版本,提供全系列稠密与混合专家(MoE)模型。基于大规模训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。
模型特点
思维与非思维模式切换
独家支持思维模式(适用于复杂逻辑推理、数学与代码)与非思维模式(适用于高效通用对话)的单模型无缝切换,确保各类场景下的最优表现。
增强的推理能力
在数学、代码生成和常识逻辑推理任务上超越前代QwQ(思维模式)与Qwen2.5指令模型(非思维模式)。
人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现优异,提供更自然、生动且沉浸式的对话体验。
智能体能力
可在思维与非思维模式下精准整合外部工具,在开源模型的复杂智能体任务中保持领先性能。
多语言支持
支持100+种语言与方言,具备强大的多语言指令遵循与翻译能力。
模型能力
文本生成
复杂逻辑推理
数学计算
代码生成
多语言翻译
智能体任务执行
多轮对话
创意写作
角色扮演
使用案例
教育与研究
数学问题解答
解决复杂的数学问题,提供逐步推理过程。
在数学推理任务上表现优异,超越前代模型。
编程辅助
生成代码片段或解决编程问题。
在代码生成任务上表现优异,超越前代模型。
创意与娱乐
创意写作
生成故事、诗歌或其他创意文本。
提供更自然、生动且沉浸式的创意写作体验。
角色扮演
模拟不同角色的对话和行为。
在多轮对话和角色扮演方面表现优异。
商业与工具
多语言翻译
支持100+种语言与方言的翻译任务。
具备强大的多语言指令遵循与翻译能力。
智能体任务
整合外部工具执行复杂任务。
在开源模型的复杂智能体任务中保持领先性能。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文