D

DNA R1

由 dnotitia 开发
DNA-R1是基于微软Phi-4优化的韩语专用推理模型,通过强化学习显著提升了韩语推理能力,在数学、编程和通用推理任务中表现出色。
下载量 1,943
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

DNA-R1是一款专为韩语优化的推理模型,展现出对韩语文本的深刻理解,并在数学、编程和通用推理任务中表现出卓越的推理能力。

模型特点

韩语专用推理优化
通过多阶段训练流程专门优化韩语推理能力,包括初始监督微调、推理模式整合和GRPO强化学习
链式思维推理
能够生成细腻的韩语链式思维(CoT),执行自我验证和解决多步骤复杂问题
文化语境理解
在推理中保持韩语文化和语言背景,使用特殊标签区分深度思考和简洁回答

模型能力

韩语文本理解
数学推理
编程问题解决
科学推理
通用问题解答
链式思维生成
自我验证

使用案例

教育
数学问题解答
解决复杂的数学问题和奥林匹克竞赛题目
在GSM8K基准测试中达到92.49分
韩语诗歌分析
理解和分析韩语诗歌中的隐含意义和文化背景
技术
编程问题解决
理解和解决编程问题和算法挑战
在LiveCodeBench基准测试中达到50.58分