Q

Qwen3 30B A3B 4bit DWQ

由 mlx-community 开发
这是一个基于Qwen3-30B-A3B模型的4位量化版本,通过从6位量化蒸馏至4位定制的DWQ量化技术制作,适用于文本生成任务。
下载量 561
发布时间 : 5/5/2025
模型介绍
内容详情
替代品

模型简介

该模型是Qwen3-30B-A3B的4位量化版本,专为高效推理设计,适用于各种文本生成场景。

模型特点

高效4位量化
通过从6位量化蒸馏至4位的定制DWQ量化技术,在保持模型性能的同时减少内存占用
mlx优化
专门为mlx框架优化,可在Apple Silicon设备上高效运行
中文文本生成
基于强大的Qwen3-30B-A3B模型,特别适合中文文本生成任务

模型能力

文本生成
对话系统
内容创作

使用案例

对话系统
智能客服
用于构建中文智能客服系统
能够理解用户意图并生成自然流畅的回复
内容创作
文章生成
自动生成各类中文文章
生成连贯、有逻辑的长文本