Y

Yixin Distill Qwen 72B 4.5bpw H6 Exl2

由 LoneStriker 开发
基于Qwen2.5-72B通过强化学习蒸馏的高性能数学推理与通用知识处理模型,在数学推理和通用知识任务中表现优异。
下载量 37
发布时间 : 3/15/2025
模型介绍
内容详情
替代品

模型简介

针对数学推理和通用知识任务专项优化的高性能大语言模型,采用前沿蒸馏技术提升推理能力的同时保持计算效率。

模型特点

数学推理专项优化
针对数学推理任务进行专项优化,在各类数学基准测试中表现优异
高效蒸馏技术
采用渐进式两阶段蒸馏法,通过智能数据选择与优化迭代提升模型性能
多语言支持
支持中英双语处理,特别优化中文语境下的表现
高质量数据筛选
采用严格的数据质量控制框架,确保训练数据的高质量和多样性

模型能力

数学问题求解
通用知识问答
多轮对话
复杂推理任务处理
中英双语处理

使用案例

教育
数学辅导
帮助学生解决各类数学问题,提供分步解题指导
在MATH-500测试中达到97.0分
知识问答
回答各类学科知识问题
在MMLU专业版测试中达到92.6分
研究
数学研究辅助
辅助研究人员进行数学问题探索和验证
在AIME-25测试中达到73.3分