A

AM Thinking V1

由 a-m-team 开发
专注于增强推理能力的320亿参数稠密语言模型,基于Qwen 2.5‑32B‑Base构建,在推理基准测试中展现出与更大规模MoE模型相媲美的性能。
下载量 1,377
发布时间 : 5/10/2025
模型介绍
内容详情
替代品

模型简介

AM-Thinking-v1是一个320亿参数的稠密语言模型,专注于增强推理能力,基于Qwen 2.5‑32B‑Base构建,通过精心设计的训练流程实现旗舰级推理能力。

模型特点

高性能推理能力
在推理基准测试中展现出与DeepSeek‑R1、Qwen3‑235B‑A22B等更大规模MoE模型相媲美的性能。
单卡部署
单张A100-80GB显卡即可部署,具有确定性延迟,无需MoE路由开销。
开源组件构建
完全基于开源组件构建,包括Qwen 2.5‑32B‑Base及强化学习训练数据。
精心设计的训练流程
通过监督微调+双阶段强化学习的训练流程,实现旗舰级推理能力。

模型能力

文本生成
复杂推理
代码生成

使用案例

推理任务
数学推理
解决复杂的数学问题
在AIME’24/’25基准测试中表现优异
代码生成
生成高质量的代码
在LiveCodeBench上超越DeepSeek‑R1