M

Mistral Nemo 12B R1 V0.2

由 CreitinGameplays 开发
基于Mistral-Nemo-Instruct-2407微调的大语言模型,专注于系统性逻辑推理和分步解答能力。
下载量 197
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

该模型在1台Nvidia H100上进行了12小时的微调,擅长处理需要分步推理的任务,如数学问题解答和逻辑分析。

模型特点

系统性推理能力
采用<think>标签格式进行结构化思考,提供至少6个逻辑步骤的详细推理过程
高效微调
仅需12小时H100训练即可获得优质推理能力
数学逻辑处理
擅长数值比较、计数等需要逐步验证的任务

模型能力

分步逻辑推理
数学问题解答
文本生成
结构化思考

使用案例

教育辅助
数学问题解答
解决需要分步验证的数学比较问题
如示例中准确比较9.9和9.11的大小
逻辑测试
字母计数
执行精确的字母位置分析和计数
如示例中正确识别'strawberry'包含3个R