D

Deepseek R1 Distill Phi 3 Mini 4k Lorar8 Alpha16 50000samples

由 GPD1 开发
基于Deepseek-R1知识蒸馏的推理模型,支持链式思维(CoT)推理能力
下载量 71
发布时间 : 1/31/2025
模型介绍
内容详情
替代品

模型简介

该模型是通过知识蒸馏技术从Deepseek-R1和Llama-70B模型提取的推理模型,专注于提升复杂推理任务的表现。

模型特点

知识蒸馏
从Deepseek-R1和Llama-70B大型模型中提取知识,保持高性能的同时减小模型规模
链式思维推理
支持CoT(Chain-of-Thought)推理能力,适合解决复杂推理问题
高效推理
基于Phi-3-mini架构优化,在保持性能的同时提高推理效率

模型能力

文本生成
复杂逻辑推理
知识问答
思维链推理

使用案例

教育
数学问题求解
解决需要多步推理的数学问题
研究
科学推理
辅助进行科学假设的推理和验证