DeepSeek-R1-Distill-phi-3-mini-4k开源推理模型

首页

Deepseek R1 Distill Phi 3 Mini 4k Lorar8 Alpha16 50000samples

由 GPD1 开发

基于Deepseek-R1知识蒸馏的推理模型，支持链式思维(CoT)推理能力

大型语言模型

Safetensors

英语开源协议:MIT #知识蒸馏推理 #英文CoT生成 #Phi-3-mini优化

下载量 71

发布时间 : 1/31/2025

模型简介

该模型是通过知识蒸馏技术从Deepseek-R1和Llama-70B模型提取的推理模型，专注于提升复杂推理任务的表现。

模型特点

知识蒸馏

从Deepseek-R1和Llama-70B大型模型中提取知识，保持高性能的同时减小模型规模

链式思维推理

支持CoT(Chain-of-Thought)推理能力，适合解决复杂推理问题

高效推理

基于Phi-3-mini架构优化，在保持性能的同时提高推理效率

模型能力

文本生成

复杂逻辑推理

知识问答

思维链推理

使用案例

教育

数学问题求解

解决需要多步推理的数学问题

研究

科学推理

辅助进行科学假设的推理和验证

属性	详情
基础模型	microsoft/Phi-3-mini-4k-instruct
训练数据集	Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B
任务类型	文本生成
标签	Deepseek、Distillation

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Deepseek R1 Distill Phi 3 Mini 4k Lorar8 Alpha16 50000samples

模型简介

模型特点

模型能力

使用案例

🚀 基于Deepseek-R1知识蒸馏模型

🚀 快速开始

📄 许可证

📦 模型信息