Q

Qwen3 4B Unsloth Bnb 4bit

由 unsloth 开发
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,在推理、指令跟随和代理能力方面表现突出。
下载量 72.86k
发布时间 : 4/28/2025
模型介绍
内容详情
替代品

模型简介

Qwen3-4B是一个因果语言模型,支持在思考和非思考模式间切换,擅长复杂逻辑推理、数学计算、代码生成和多轮对话。

模型特点

双模式切换
支持在思考模式(用于复杂推理)和非思考模式(用于高效对话)间无缝切换
增强推理能力
在数学、代码生成和常识逻辑推理方面超越前代模型
多语言支持
支持100多种语言和方言的指令跟随和翻译
长上下文处理
原生支持32,768 token上下文,通过YaRN扩展至131,072 token
工具集成能力
可精确集成外部工具,在基于代理的任务中表现优异

模型能力

文本生成
逻辑推理
数学计算
代码生成
多轮对话
多语言处理
工具调用
长文本理解

使用案例

教育
数学问题解答
解答复杂数学问题并展示推理过程
在数学推理基准测试中表现优异
编程教学
生成代码示例并解释编程概念
能够生成高质量的代码和解释
商业
多语言客服
提供多语言客户支持服务
支持100多种语言的流畅对话
文档分析
处理和分析长文档内容
可处理长达131,072 token的文档
开发
AI代理开发
构建能够调用外部工具的智能代理
在复杂代理任务中表现领先