S

Skywork O1 Open Llama 3.1 8B

由 Skywork 开发
Skywork o1 Open-Llama-3.1-8B是基于Llama-3.1-8B训练的强力对话模型,通过'慢思考'推理风格数据显著增强推理能力。
下载量 583
发布时间 : 11/26/2024
模型介绍
内容详情
替代品

模型简介

具备类o1慢思考推理能力的先进模型,专长解决数学、编程和逻辑推理等复杂问题。

模型特点

慢思考推理能力
通过专有训练方法实现深度思考、规划和反思能力
三阶段训练方案
包含反思式推理训练、推理能力强化学习和推理规划
Q*在线推理算法
首次实现并公开发布的先进推理算法,优化推理路径

模型能力

复杂问题求解
数学推理
逻辑推理
编程问题解答
伦理决策分析
自我验证

使用案例

教育
数学问题解答
解决各类数学应用题和方程式
在GSM8K等数学测试集上表现优异
编程
算法问题解决
分析并解决编程算法问题
在HumanEval等编程测试中表现突出
逻辑分析
逻辑推理题
解答各类逻辑关系和类比推理问题
展示出优秀的逻辑分析能力