N

Nuke X Gemma3 1B Reasoner Testing

由 NuclearAi 开发
基于Google Gemma-3-1B优化的推理增强模型,通过GRPO算法和高质量数据集提升逻辑推理能力
下载量 77
发布时间 : 3/31/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对Gemma-3-1B的优化版本,专注于提升文本生成和逻辑推理能力,适用于对话式AI场景

模型特点

推理能力增强
通过GRPO算法和专用训练数据集显著提升原版Gemma的推理能力
高效微调
仅使用150条高质量数据进行5步微调,30分钟内完成训练
Unsloth优化
采用Unsloth框架进行高效训练和推理优化

模型能力

文本生成
逻辑推理
对话式AI
故事创作

使用案例

创意写作
短篇故事生成
生成符合逻辑的创意短篇故事
如示例中生成的'学会飞行的猫'故事
问答系统
结构化问题解答
提供包含推理过程的详细解答
模型会先展示思考过程再给出最终答案