F

Fairyr1 32B

由 PKU-DS-LAB 开发
FairyR1-32B是一款高效的大型语言模型,基于DeepSeek-R1-Distill-Qwen-32B,通过优化的蒸馏与合并流程,在数学和编程任务上表现优异。
下载量 372
发布时间 : 5/23/2025
模型介绍
内容详情
替代品

模型简介

FairyR1-32B是一款专注于数学和编程任务的高效语言模型,通过任务导向的微调和模型合并技术,显著降低了模型规模和推理成本,同时保持高性能。

模型特点

高效性能
仅使用约5%的参数,在数学和编程任务上表现与更大规模模型相当或更优。
优化的蒸馏流程
通过多阶段数据筛选和重构,精选高质量训练样本,提升模型性能。
模型合并技术
使用AcreeFusion工具将多个专家模型融合为统一模型,简化架构并降低成本。

模型能力

数学问题解答
代码生成
科学问答
文本生成

使用案例

教育
数学竞赛题解答
用于解答AIME等数学竞赛题目,提供详细解题步骤。
在AIME 2024和2025测试中表现优异。
编程
代码生成与优化
生成和优化编程代码,支持多种编程语言。
在LiveCodeBench测试中表现优于同类模型。