D

Deepseek Qwen Bllossom 32B

由 UNIVA-Bllossom 开发
DeepSeek-qwen-Bllossom-32B是基于DeepSeek-R1-Distill-Qwen-32B模型构建的,旨在提升韩语环境下的推理性能。
下载量 167
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

该模型通过额外训练克服了原基础模型在韩语推理时的性能下降问题,实现了内部思考过程以英语进行,最终根据用户输入语言输出响应,大幅提升了韩语环境下的推理表现。

模型特点

多语言推理能力
内部思考过程以英语进行,最终根据用户输入语言输出响应,显著提升韩语推理性能。
高质量训练数据
训练数据包含韩英双语推理数据集,涵盖多领域内容,提供更准确可靠的韩语推理结果。
高效蒸馏方法
采用大模型优秀推理能力向基础模型高效蒸馏的方法,有效弥补原模型不足。

模型能力

韩语文本生成
英语文本生成
复杂推理任务
多领域知识问答

使用案例

教育
数学问题解答
解决复杂的数学推理问题,如分数计算、代数问题等。
在AIME24_ko基准测试中达到66.67分,显著优于原模型。
研究
数学定理证明
提供多种数学定理的证明方法,如素数无限的证明。
能提供多种角度的证明方法,包括欧几里得反证法、阶乘法和欧拉ζ函数法。