D

Deepseek R1 Distill Qwen 7B Japanese

由 lightblue 开发
这是DeepSeek R1模型的日语版本,专门针对日语推理任务进行微调,能够可靠且准确地以日语响应提示。
下载量 1,067
发布时间 : 1/24/2025

模型简介

该模型是基于DeepSeek-R1-Distill-Qwen-7B在日语推理数据集上进行微调的版本,解决了原模型在日语提示下输出不一致的问题。

模型特点

日语优化
专门针对日语进行微调,解决了原模型在日语提示下输出不一致的问题
高效训练
在阿里云8 x L20实例上训练不到10分钟即完成
推理能力
保留了原模型的优秀推理能力,特别适合解决数学和逻辑问题
输出一致性
相比原模型,在日语输出上更加稳定和可靠

模型能力

日语文本生成
数学推理
逻辑问题解答
多轮对话

使用案例

教育
数学问题解答
解答日语数学问题,特别是需要多步推理的问题
在GSM8K日语测试集上达到70%准确率
客服
日语客户咨询
处理日语客户的咨询和问题
AIbase
智启未来,您的人工智能解决方案智库
简体中文