D

Deepseek R1 Distill Qwen 1.5B Turkish

由 duxx 开发
本模型是基于DeepSeek-R1-Distill-Qwen-1.5B在土耳其语-R1数据集上微调的版本,主要用于土耳其语相关推理任务。
下载量 124
发布时间 : 2/7/2025

模型简介

该模型是针对土耳其语优化的推理模型,在特定数据集上进行了微调,适用于土耳其语文本处理任务。

模型特点

土耳其语优化
专门针对土耳其语进行了微调,提升了土耳其语文本处理能力
蒸馏模型
基于知识蒸馏技术,在保持性能的同时减小模型规模
多GPU训练
使用8个GPU进行分布式训练,提高了训练效率

模型能力

土耳其语文本理解
土耳其语文本生成
土耳其语推理任务

使用案例

自然语言处理
土耳其语文本分析
用于分析土耳其语文本内容
在评估集上损失值为1.1396
土耳其语问答系统
构建土耳其语问答应用
AIbase
智启未来,您的人工智能解决方案智库
简体中文