M

Minithinky V2 1B Llama 3.2

由 ngxson 开发
MiniThinky 1B是基于Llama-3.2-1B-Instruct微调的AI助手模型,特点是在回答前会进行思考过程展示
下载量 260
发布时间 : 1/8/2025
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的1B参数规模的语言模型,专门设计用于在回答问题前展示思考过程。采用Llama 3相同的聊天模板,但增加了思考步骤的标记输出。

模型特点

思考过程可视化
在生成最终答案前会输出<|thinking|>标记的思考过程
系统消息敏感
对系统消息非常敏感,需要特定格式的系统提示才能获得最佳表现
改进版本
v2版本相比v1损失值从0.7降至0.5,训练时间增加6小时

模型能力

对话生成
问题解答
思考过程展示

使用案例

AI助手
智能问答
作为智能助手回答用户问题
会先展示思考过程再给出答案