P

Phi 4 Reasoning Plus

由 unsloth 开发
Phi-4推理增强版是微软研究院开发的140亿参数开源推理模型,通过监督微调和强化学习优化,专注于数学、科学和编程领域的高级推理能力。
下载量 189
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

基于Phi-4的增强版推理模型,通过高质量数据集和强化学习训练,在数学推理、代码生成和科学问题解决方面表现优异,支持32k上下文长度。

模型特点

强化推理能力
通过思维链追踪数据集和强化学习优化,显著提升复杂推理任务的准确性
长上下文处理
支持32k标记的上下文长度,可处理深度多步推理任务
高效架构
仅140亿参数的小型模型实现接近更大模型的性能
安全对齐
通过严格的安全后训练方法确保符合负责任AI准则

模型能力

数学问题求解
科学推理
代码生成
算法问题解决
逻辑推理
多轮对话

使用案例

教育
数学奥赛辅导
解决AIME等数学竞赛的复杂问题
在AIME 2025测试中达到78%准确率
科研
科学问题分析
解答研究生级别的科学问题
GPQA-Diamond基准68.9%准确率
软件开发
竞赛级代码生成
解决编程竞赛问题
LiveCodeBench基准53.1%准确率