Q

Qwen3 1.7B Base Unsloth Bnb 4bit

由 unsloth 开发
Qwen3-1.7B-Base是通义千问系列最新一代大语言模型,提供高质量的预训练语言模型能力。
下载量 689
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-1.7B-Base是一个17亿参数的因果语言模型,专注于通用语言建模与知识获取,支持32k超长上下文理解。

模型特点

高质量预训练语料库
覆盖119种语言的36万亿token,显著提升编程、STEM、推理等高价值内容占比。
训练技术与架构优化
采用MoE模型全局批次负载均衡损失、全模型qk层归一化等创新技术,提升训练稳定性与性能。
三阶段预训练体系
分阶段强化通用语言建模、STEM/编程/逻辑推理能力以及长文本理解。
超长上下文支持
支持32k超长上下文训练,增强长文本理解能力。

模型能力

文本生成
语言理解
编程能力
逻辑推理
长文本处理

使用案例

自然语言处理
文本生成
生成高质量的自然语言文本
编程辅助
辅助编写和优化代码
教育
STEM教育
辅助STEM领域的学习和教学