Arcana-Qwen3-2.4B-A0.6B开源AI模型 - 低内存高效运行，输出精准结果

首页

Arcana Qwen3 2.4B A0.6B

由 suayptalha 开发

这是一个基于Qwen3的混合专家模型（MoE），总参数量为24亿，包含4个6亿参数的专家模型，旨在以更高效率和更低内存占用提供更准确的结果。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #混合专家推理 #领域自适应路由 #低资源高效推理

下载量 199

发布时间 : 5/12/2025

模型简介

该模型是一个混合专家（Mixture of Experts，MoE）模型，结合了代码、数学、医学和指令遵循四个领域的专家模型，适用于多领域的文本生成任务。

模型特点

混合专家模型

结合四个领域的专家模型（代码、数学、医学、指令遵循），提供更高效和准确的文本生成。

高效推理

通过路由模型动态选择专家，降低内存占用和计算成本。

多领域支持

覆盖代码生成、数学推理、医学问答和通用指令遵循等多种任务。

模型能力

代码生成

数学推理

医学问答

指令遵循

条件判断

文本生成

使用案例

医疗

医学问答

回答与医学相关的问题，如症状分析、治疗建议等。

编程

代码生成

根据需求生成代码片段或解决编程问题。

数学

数学推理

解决数学问题或进行逻辑推理。

通用

指令遵循

根据用户指令生成相应的文本回复。

🚀 Arcana Qwen3 2.4B A0.6B

这是一个基于专家混合（MoE）的Qwen3模型，总参数数量为24亿，4个专家模型每个各有6亿参数。所有专家模型如下所示。该模型旨在以更高的效率和更低的内存使用提供更准确的结果！

The Imitation Game

"我们都在某方面是专家，但在其他方面也都是初学者。"

— 《模仿游戏》（2014）

模型信息

属性	详情
基础模型	Qwen/Qwen3 - 0.6B
任务类型	文本生成
库名称	transformers
标签	moe、qwen3、代码、数学、推理、医学、指令、if
数据集	nvidia/OpenCodeReasoning、unsloth/OpenMathReasoning - mini、patrickfleith/instruction - freak - reasoning、FreedomIntelligence/medical - o1 - reasoning - SFT、Malikeh1375/medical - question - answering - datasets、Myashka/SO - Python_QA - filtered - 2023 - no_code - tanh_score、ArdentTJ/t1_daily_conversations

✨ 主要特性

这是一个MoE（专家混合）Qwen3模型，总共有24亿个参数，4个专家模型每个各有6亿参数。该模型旨在以更高的效率和更低的内存使用提供更准确的结果！

🔧 技术细节

专家模型：

关键训练参数（SFTConfig）

per_device_train_batch_size = 2
gradient_accumulation_steps = 4
warmup_steps = 5
num_train_epochs = 1
learning_rate = 2e-5
optim = "adamw_8bit"
weight_decay = 0.01
seed = 3407

代码专家模型：

suayptalha/Qwen3 - 0.6B - Code - Expert

该模型在nvidia/OpenCodeReasoning数据集的前20000行上使用BF16进行了1个epoch的全量微调。

数学专家模型：

suayptalha/Qwen3 - 0.6B - Math - Expert

该模型在整个unsloth/OpenMathReasoning - mini数据集上使用BF16进行了1个epoch的全量微调。

医学专家模型：

suayptalha/Qwen3 - 0.6B - Medical - Expert

该模型在FreedomIntelligence/medical - o1 - reasoning - SFT数据集的前20000行上使用BF16进行了1个epoch的全量微调。

指令遵循专家模型：

Qwen/Qwen3 - 0.6B

Qwen/Qwen3 - 0.6B模型直接用作此专家模型，未进行微调。

路由模型：

路由模型可在[此处](https://huggingface.co/suayptalha/MoE - Router - v2)找到，它是distilbert/distilbert - base - uncased在7个不同数据集上训练得到的版本。

💻 使用示例

基础用法

import torch
from huggingface_hub import snapshot_download
from transformers import AutoModelForCausalLM, AutoTokenizer

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

local_dir = snapshot_download(
    repo_id="suayptalha/Qwen3-2.4B-A0.6B",
)

model = AutoModelForCausalLM.from_pretrained(
    local_dir,
    trust_remote_code=True,
)
tokenizer = AutoTokenizer.from_pretrained(
    local_dir,
)

model.to(device)
model.eval()

prompt = "I have pain in my chest, what should I do?"
messages = [{"role": "user", "content": prompt}]

prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

with torch.no_grad():
    output_ids = model.generate(
        text=prompt,
        max_new_tokens=1024,
        temperature=0.6,
        top_p=0.95,
    )
output_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
print(output_text)