M

Marco O1

由 AIDC-AI 开发
Marco-o1是一个专注于开放式解决方案的开放推理模型,通过思维链微调、蒙特卡洛树搜索和反思机制增强复杂问题解决能力。
下载量 5,007
发布时间 : 11/13/2024
模型介绍
内容详情
替代品

模型简介

Marco-o1大语言模型通过思维链微调、蒙特卡洛树搜索(MCTS)、反思机制和创新推理策略优化,专为复杂现实问题求解任务设计,特别关注缺乏明确标准答案的开放式问题。

模型特点

思维链微调
基于开源CoT数据集与自研合成数据全参数微调,构建Marco-o1-CoT模型
MCTS扩展解空间
融合LLM与蒙特卡洛树搜索(Marco-o1-MCTS),利用模型置信度指导搜索
推理动作策略
实现推理动作策略与反思机制,包括MCTS框架内多粒度动作探索与模型自反思
多语言应用
首次将大推理模型应用于机器翻译任务,探索多语言领域的推理缩放规律

模型能力

复杂问题推理
数学解题
编程问题解决
多语言翻译
开放式问题解答

使用案例

教育
数学问题求解
解决需要多步推理的数学问题
在MGSM数据集上准确率提升6.17%
编程
算法问题解决
解决需要创造性思维的编程挑战
翻译
俚语翻译
精准翻译口语化表达
如将'踩屎感'译为'comfortable sole'