T

Tinyr1 32B Preview

由 qihoo360 开发
Tiny-R1-32B-Preview 是一个基于 Deepseek-R1-Distill-Qwen-32B 的推理模型,专注于数学、代码和科学领域,性能接近完整版 R1 模型。
下载量 3,292
发布时间 : 2/24/2025
模型介绍
内容详情
替代品

模型简介

该模型通过监督微调(SFT)和模型融合技术,在数学、编程和科学任务上表现出色,尤其在数学领域超越了一些更大的模型。

模型特点

高性能数学推理
在数学任务(AIME 2024)上表现优于70B模型,接近完整版R1模型。
多领域融合
通过融合数学、编程和科学三个领域的专用模型,实现综合性能提升。
开源训练流程
提供完整的训练与评估流程,以及精选的训练数据集。

模型能力

数学推理
编程任务解答
科学问答
文本生成

使用案例

教育
数学问题求解
求解复杂的数学问题,如积分计算。
在AIME 2024测试中达到78.1分。
编程
编程任务解答
解答编程相关的问题和任务。
在LiveCodeBench测试中达到61.6分。
科学研究
科学问答
回答科学领域的问题。
在GPQA-Diamond测试中达到65.0分。