Denker-mistral-nemo-12B开源推理模型 - 小型无审查精准推理超实用

Denker Mistral Nemo 12B

由 nbeerbower 开发

Denker是一个小型、无审查、专注于推理的模型，基于mistral-nemo-kartoffel-12B使用ORPO和QLoRA进行微调。

下载量 20

发布时间 : 5/12/2025

模型简介

这是一个实验性模型，专注于推理和思维链能力，采用无审查设计，适用于需要逻辑推理和问题解决的任务。

无审查设计

模型设计为无审查，适合需要自由表达和探索性思考的场景

推理优化

专注于逻辑推理和问题解决能力，特别强化了思维链表现

ORPO微调

使用ORPO(Odds Ratio Preference Optimization)方法进行微调

QLoRA高效训练

采用QLoRA技术进行参数高效微调

文本生成

逻辑推理

数学问题解答

代码推理

物理推理

思维链推理

教育与研究

数学问题解答

解决复杂的数学推理问题

物理推理

理解和解决物理相关的问题

编程辅助

代码推理

帮助理解和生成代码

一般推理

逻辑问题解答

解决需要复杂逻辑推理的问题

属性	详情
库名称	transformers
许可证	apache-2.0
基础模型	nbeerbower/mistral-nemo-kartoffel-12B
数据集	nbeerbower/Schule-DPO、nbeerbower/Purpura-DPO、nbeerbower/Arkhaios-DPO、jondurbin/truthy-dpo-v0.1、antiven0m/physical-reasoning-dpo、Atsunori/HelpSteer2-DPO、GeneralReasoning/GeneralThought-430K、nvidia/OpenMathReasoning、nvidia/OpenCodeReasoning
标签	orpo、uncensored、reasoning、chain-of-thought、qlora、experimental