Q

Qwen3 30B A3B Base

由 Qwen 开发
Qwen3-30B-A3B-Base是通义千问系列最新一代30.5B参数规模的混合专家(MoE)大语言模型,支持119种语言和32k上下文长度。
下载量 9,745
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

基于三阶段预训练框架开发的MoE架构大语言模型,专注于通用语言建模、STEM/编程能力强化及长上下文理解。

模型特点

多语言覆盖
预训练数据覆盖119种语言的36万亿token,语言覆盖范围达前代的三倍
MoE架构优化
采用全局批次负载均衡损失和qk层归一化技术,提升训练稳定性
三阶段预训练
分阶段强化通用能力、STEM/编程/推理能力及长上下文理解

模型能力

多语言文本生成
代码生成与补全
复杂逻辑推理
长文档理解
数学问题求解

使用案例

开发辅助
代码自动补全
支持多种编程语言的代码生成与错误修复
教育科研
STEM问题求解
解答数学、物理等学科的复杂问题