P

Phi 4 Reasoning Unsloth Bnb 4bit

由 unsloth 开发
Phi-4-reasoning是一款由微软开发的先进推理模型,基于Phi-4进行微调,专注于提升数学、科学和编码等领域的推理能力。
下载量 1,969
发布时间 : 5/1/2025

模型简介

Phi-4-reasoning是一款开放权重的推理模型,通过监督微调和强化学习训练,适用于需要复杂推理任务的场景。

模型特点

先进的推理能力
通过监督微调和强化学习,专注于数学、科学和编码等领域的推理能力提升。
高效的架构设计
基于Phi-4基础模型,采用14B参数的密集仅解码器Transformer架构。
长上下文处理能力
支持32k令牌的上下文长度,能够处理复杂的输入。
广泛评估验证
在多个开源和内部基准测试中进行了评估,展示了出色的性能。

模型能力

数学推理
科学问题解答
代码生成
算法问题解决
复杂输入处理

使用案例

教育
数学奥林匹克问题解答
解决高难度的数学奥林匹克问题。
在AIME 2025基准测试中得分62.9。
科学问题解答
回答复杂的科学问题。
在GPQA-Diamond基准测试中得分65.8。
编程
代码生成
生成功能代码。
在HumanEvalPlus基准测试中得分92.9。
算法问题解决
解决3SAT和TSP等算法问题。
在LiveCodeBench基准测试中得分53.8。
AIbase
智启未来,您的人工智能解决方案智库
简体中文