M

M1 32b

由 Can111 开发
M1-32B是基于Qwen2.5-32B-Instruct微调的320亿参数大语言模型,专为提升多智能体系统中的推理、讨论和决策能力而优化。
下载量 179
发布时间 : 3/11/2025
模型介绍
内容详情
替代品

模型简介

该模型通过多智能体协作推理训练,增强在复杂任务中的推理能力和角色感知对话生成能力,适用于多智能体系统(MAS)的研究和应用。

模型特点

增强型协作推理
基于真实多智能体交互轨迹训练,涵盖专家招募官、问题解决者、评估者等多元角色。
角色感知对话生成
通过结构化提示学习从不同专家视角进行推理和回应。
多智能体系统优化
具备自适应协作和token预算管理能力,是优秀的MAS智能体。

模型能力

多智能体协作推理
数学问题求解
编程任务解决
跨语言文本生成
角色感知对话生成

使用案例

学术研究
多智能体系统研究
用于研究多智能体协作推理机制和决策过程
在MATH-500和MBPP-S任务上达到与o3-mini和DeepSeek-R1相当的水平
教育
数学问题求解
协助学生解决复杂数学问题
在AIME2024和MATH-500测试中表现优异