P

Phi 4 Reasoning

由 microsoft 开发
Phi-4推理是基于Phi-4通过监督微调思维链轨迹数据集和强化学习训练的前沿开放权重推理模型,专注于数学、科学和编程技能。
下载量 11.31k
发布时间 : 4/9/2025
模型介绍
内容详情
替代品

模型简介

Phi-4推理是一个专注于数学推理、科学和编程的语言模型,通过高质量和高级推理数据进行训练,适用于内存/计算受限环境和延迟敏感场景。

模型特点

高质量推理数据训练
通过监督微调思维链轨迹数据集和强化学习训练,专注于数学、科学和编程技能。
长上下文支持
支持32k词元的上下文长度,适合处理复杂查询和长文本推理。
安全对齐
通过监督微调采用强大的安全后训练方法,确保模型响应符合安全与伦理准则。

模型能力

数学推理
科学问题解答
代码生成
聊天对话
逻辑推理

使用案例

教育
数学问题解答
解答奥赛级数学问题,如AIME竞赛题目。
在AIME 2024上达到75.3分
编程
代码生成
生成功能性代码,解决编程竞赛问题。
在LiveCodeBench上达到53.8分
研究
科学问题解答
解答研究生级科学问题,如GPQA-Diamond数据集。
在GPQA-D上达到65.8分