Q

Qwen3 1.7B Base

由 Qwen 开发
Qwen3-1.7B是通义千问系列最新一代17亿参数基础语言模型,采用三阶段预训练体系,支持32k上下文长度。
下载量 19.24k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

基于36万亿token多语言数据预训练的因果语言模型,专注通用语言建模与专项能力强化。

模型特点

多阶段预训练体系
三阶段训练流程:通用语言建模→STEM/编程专项强化→32k长上下文适应
超大规模语料
基于36万亿token的119种语言数据,覆盖编程/STEM/推理等多领域
训练技术创新
采用全局批次负载均衡损失和qk层归一化技术提升训练稳定性

模型能力

多语言文本生成
长文本理解(32k上下文)
编程代码生成
逻辑推理
STEM问题解答

使用案例

智能助手
多轮对话系统
支持长上下文记忆的对话应用
教育
STEM解题辅导
数学/科学问题分步解答