Q

Qwen3 4B Base

由 unsloth 开发
Qwen3-4B-Base是通义千问系列最新一代40亿参数量的预训练语言模型,支持32k上下文长度和多语言处理。
下载量 15.15k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

基于创新的三阶段预训练范式开发的大语言模型,专注于通用语言建模、STEM/编程/逻辑推理能力强化以及长文本理解。

模型特点

多语言覆盖
预训练数据覆盖119种语言的36万亿token,语言覆盖范围达前代的三倍
三阶段预训练
分阶段强化通用语言能力、STEM/编程/逻辑推理能力以及长文本理解能力
长上下文支持
支持32,768 tokens的超长上下文处理能力
训练技术创新
采用MoE负载均衡损失、全模型qk层归一化等技术提升训练稳定性

模型能力

多语言文本生成
长文本理解
编程代码生成
逻辑推理
STEM问题解答

使用案例

智能助手
多语言客服机器人
构建支持多语言的智能客服系统
可处理119种语言的用户查询
教育科技
编程学习助手
辅助编程学习者理解代码和解决问题
强化后的编程能力可提供更准确的代码解释