F
Fairyr1 32B
由 PKU-DS-LAB 开发
FairyR1-32B是一款高效的大型语言模型,基于DeepSeek-R1-Distill-Qwen-32B,通过优化的蒸馏与合并流程,在数学和编程任务上表现优异。
下载量 372
发布时间 : 5/23/2025
模型简介
FairyR1-32B是一款专注于数学和编程任务的高效语言模型,通过任务导向的微调和模型合并技术,显著降低了模型规模和推理成本,同时保持高性能。
模型特点
高效性能
仅使用约5%的参数,在数学和编程任务上表现与更大规模模型相当或更优。
优化的蒸馏流程
通过多阶段数据筛选和重构,精选高质量训练样本,提升模型性能。
模型合并技术
使用AcreeFusion工具将多个专家模型融合为统一模型,简化架构并降低成本。
模型能力
数学问题解答
代码生成
科学问答
文本生成
使用案例
教育
数学竞赛题解答
用于解答AIME等数学竞赛题目,提供详细解题步骤。
在AIME 2024和2025测试中表现优异。
编程
代码生成与优化
生成和优化编程代码,支持多种编程语言。
在LiveCodeBench测试中表现优于同类模型。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文