D

Denker Mistral Nemo 12B

由 nbeerbower 开发
Denker是一个小型、无审查、专注于推理的模型,基于mistral-nemo-kartoffel-12B使用ORPO和QLoRA进行微调。
下载量 20
发布时间 : 5/12/2025
模型介绍
内容详情
替代品

模型简介

这是一个实验性模型,专注于推理和思维链能力,采用无审查设计,适用于需要逻辑推理和问题解决的任务。

模型特点

无审查设计
模型设计为无审查,适合需要自由表达和探索性思考的场景
推理优化
专注于逻辑推理和问题解决能力,特别强化了思维链表现
ORPO微调
使用ORPO(Odds Ratio Preference Optimization)方法进行微调
QLoRA高效训练
采用QLoRA技术进行参数高效微调

模型能力

文本生成
逻辑推理
数学问题解答
代码推理
物理推理
思维链推理

使用案例

教育与研究
数学问题解答
解决复杂的数学推理问题
物理推理
理解和解决物理相关的问题
编程辅助
代码推理
帮助理解和生成代码
一般推理
逻辑问题解答
解决需要复杂逻辑推理的问题