Q

Qwen3 4B 128K GGUF

由 unsloth 开发
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,在推理、指令遵循、代理能力和多语言支持方面表现优异。
下载量 15.41k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-4B是一个4B参数的因果语言模型,支持思维模式和非思维模式的切换,适用于复杂逻辑推理、数学计算、代码生成和通用对话等多种场景。

模型特点

思维模式切换
支持在思维模式(用于复杂推理)和非思维模式(用于高效对话)间无缝切换
增强推理能力
在数学、代码生成和常识逻辑推理方面表现优异
多语言支持
支持100多种语言和方言,具备强大的多语言指令遵循和翻译能力
长上下文支持
原生支持32,768个token,通过YaRN扩展可支持131,072个token

模型能力

文本生成
代码生成
数学推理
多轮对话
多语言翻译
工具集成

使用案例

教育
数学问题解答
帮助学生解决复杂的数学问题,展示推理过程
提高学习效率,增强理解能力
开发
代码生成与调试
根据需求生成代码片段或帮助调试现有代码
提高开发效率,减少编码错误
商业
多语言客服
提供多语言的客户服务对话支持
降低人力成本,提高服务响应速度