DeepSeek-Qwen2.5-14B-DeepThinker-v2开源大模型

首页

Deepseek Qwen2.5 14B DeepThinker V2

由 Vijayendra 开发

DeepThinkerv2是一个具备深度数学推理能力的大语言模型，通过递归思考模式和多重验证机制提升解题准确性。

大型语言模型

Safetensors

英语开源协议:MIT #递归式数学推理 #结构化问题求解 #多步验证思维链

下载量 113

发布时间 : 4/25/2025

模型简介

该模型专注于数学推理和结构化问题解决，通过颗粒化思维链和递归验证机制确保计算准确性，特别适合复杂逻辑和数学问题。

模型特点

递归验证机制

通过多次'稍等，我再确认下'的步骤校验每个中间结果，确保推理准确性

颗粒化思维链

思维过程呈现高度颗粒化特征，每个步骤都展现递归思考模式

数学推理优化

针对数学问题特别优化，支持复杂表达式解析和结构化推理

4位量化支持

支持NF4格式的4位量化配置，显著降低显存需求

模型能力

数学问题求解

逻辑推理

结构化文本生成

理论分析

多步问题拆解

使用案例

学术研究

数学竞赛题解答

解决AIME等数学竞赛中的复杂题目

在AIME2024测试中达到70%准确率

理论分析

进行哲学、物理等领域的理论推演

教育辅助

数学教学辅助

分步解析数学问题，展示解题过程

在MATH500测试中达到93.6%-95.4%准确率

🚀 深度思考者v2模型介绍

深度思考者v2模型能够反复检查运算过程，来回转换单位，并在每一个中间结果处进行多次验证，展现出“等等，让我再检查一下”的严谨态度。其思维链条极为细致，几乎在每一步都体现出递归思维，甚至会用多种方法重新解决问题的部分环节。

如果你想体验该模型与当前其他思维模型的差异，请尝试以下测试问题（无需联网）。

🚀 快速开始

安装依赖

!pip install bitsandbytes peft

代码示例

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

# ✅ 模型名称 
MODEL_NAME = "Vijayendra/DeepSeek-Qwen2.5-14B-DeepThinker-v2"

# ✅ 4位量化配置
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",  # 你也可以尝试 "fp4"
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=torch.float32
)

# ✅ 加载分词器
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)

# ✅ 加载量化模型
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    device_map="auto",
    quantization_config=bnb_config,
    torch_dtype=torch.float16  # 可选，但有助于节省内存
)

print("\n🚀 模型已成功加载到GPU上！ 🚀")
print(model.hf_device_map)

# 🛠 **定义推理函数**
def generate_response(model, tokenizer, prompt, max_new_tokens=4096, temperature=0.7):
    
    # 对输入进行分词
    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(model.device)
    # 确保传递注意力掩码
    attention_mask = inputs.attention_mask
    # 生成回复
    with torch.no_grad():
        generated_tokens = model.generate(
            inputs.input_ids,
            attention_mask=inputs.attention_mask,  # 确保传递注意力掩码
            max_new_tokens=max_new_tokens,
            temperature=temperature,
            do_sample=True,
            top_k=40,
            top_p=0.9,
            eos_token_id=tokenizer.eos_token_id,
            pad_token_id=tokenizer.pad_token_id
        )

    # 解码回复
    return tokenizer.decode(generated_tokens[0], skip_special_tokens=True)

# **测试问题**
questions = [
    # 用于检查模型逻辑构建行为的常规问题
    "如果一个时间旅行者回到过去并阻止了自己的出生，那么他们如何存在并阻止自己的出生呢？鉴于这个悖论，时间旅行在逻辑上是否与因果关系一致？请解释在任何已知的物理理论下，这样的事件是否可能发生。",
    "如果地球没有轴向倾斜会怎样？描述这对气候、生态系统和人类文明的长期影响。技术和农业的发展会有所不同吗？",
    "一个数列遵循这样的模式：2, 6, 12, 20, 30, 42, ... 第50项是多少，第n项的通项公式是什么？",
    "如果一个AI模型变得有自我意识，它如何知道自己有自我意识呢？AI能否向人类观察者证明自己的意识？请结合哲学和神经科学的例子进行讨论。",

    # 2024年美国数学邀请赛（AIME 2024）难度的数学问题 - 来自https://artofproblemsolving.com/wiki/index.php/2024_AIME_I的前4个问题
    "每天早上，阿雅都会进行一次9公里的散步，然后在一家咖啡店停留。当她以恒定速度s公里/小时行走时，这次散步包括在咖啡店停留的t分钟，总共需要4小时。当她以s + 2公里/小时的速度行走时，这次散步包括在咖啡店停留的t分钟，总共需要2小时24分钟。假设阿雅以s + 1/2公里/小时的速度行走。求这次散步包括在咖啡店停留的t分钟总共需要多少分钟？",
    "存在大于1的实数x和y，使得log_x(y^x) = log_y(x^4y) = 10。求xy的值？",
    "爱丽丝和鲍勃玩以下游戏。一堆n个代币摆在他们面前。玩家轮流进行，爱丽丝先开始。在每一轮中，玩家可以从堆中移除1个或4个代币。移除最后一个代币的玩家获胜。求小于或等于2024的正整数n的数量，使得鲍勃存在一种策略，无论爱丽丝如何玩，都能保证鲍勃获胜？",
    "珍通过从集合S = {1, 2, 3, ..., 9, 10}中选择4个不同的数字参加抽奖。从集合S中随机选择4个数字。如果她选择的数字中至少有两个与随机选择的数字相同，她就赢得奖品；如果她选择的四个数字都与随机选择的数字相同，她就赢得大奖。已知她赢得了奖品，她赢得大奖的概率是m/n，其中m和n是互质的正整数。求m + n的值。",

    # 2025年美国数学邀请赛（AIME 2025）的前2个问题 - 来自https://artofproblemsolving.com/wiki/index.php/2025_AIME_I
    "求所有大于9的整数基数b的和，使得17_b是97_b的因数。",
    "在三角形ABC中，点A、D、E和B按此顺序位于边AB上，AD = 4，DE = 16，EB = 8。点A、F、G和C按此顺序位于边AC上，AF = 13，FG = 52，GC = 26。设M是D关于F的对称点，设N是G关于E的对称点。四边形DEGF的面积为288。求七边形AFNBCEM的面积。"
]


# **生成并打印回复**
for i, question in enumerate(questions, 1):
    response = generate_response(model, tokenizer, question)
    print(f"\n🟢 问题 {i}: {question}")
    print(f"🔵 回复: {response}")

✨ 主要特性

深度思考能力：能够反复检查运算过程，细致地处理问题，展现出递归思维，甚至用多种方法解决问题的部分环节。
广泛的适用性：可用于回答多种类型的问题，包括逻辑推理、数学计算、哲学思考等。

📦 安装指南

!pip install bitsandbytes peft

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

# ✅ 模型名称 
MODEL_NAME = "Vijayendra/DeepSeek-Qwen2.5-14B-DeepThinker-v2"

# ✅ 4位量化配置
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",  # 你也可以尝试 "fp4"
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=torch.float32
)

# ✅ 加载分词器
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)

# ✅ 加载量化模型
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    device_map="auto",
    quantization_config=bnb_config,
    torch_dtype=torch.float16  # 可选，但有助于节省内存
)

print("\n🚀 模型已成功加载到GPU上！ 🚀")
print(model.hf_device_map)

高级用法

# 🛠 **定义推理函数**
def generate_response(model, tokenizer, prompt, max_new_tokens=4096, temperature=0.7):
    
    # 对输入进行分词
    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(model.device)
    # 确保传递注意力掩码
    attention_mask = inputs.attention_mask
    # 生成回复
    with torch.no_grad():
        generated_tokens = model.generate(
            inputs.input_ids,
            attention_mask=inputs.attention_mask,  # 确保传递注意力掩码
            max_new_tokens=max_new_tokens,
            temperature=temperature,
            do_sample=True,
            top_k=40,
            top_p=0.9,
            eos_token_id=tokenizer.eos_token_id,
            pad_token_id=tokenizer.pad_token_id
        )

    # 解码回复
    return tokenizer.decode(generated_tokens[0], skip_special_tokens=True)

# **测试问题**
questions = [
    # 用于检查模型逻辑构建行为的常规问题
    "如果一个时间旅行者回到过去并阻止了自己的出生，那么他们如何存在并阻止自己的出生呢？鉴于这个悖论，时间旅行在逻辑上是否与因果关系一致？请解释在任何已知的物理理论下，这样的事件是否可能发生。",
    "如果地球没有轴向倾斜会怎样？描述这对气候、生态系统和人类文明的长期影响。技术和农业的发展会有所不同吗？",
    "一个数列遵循这样的模式：2, 6, 12, 20, 30, 42, ... 第50项是多少，第n项的通项公式是什么？",
    "如果一个AI模型变得有自我意识，它如何知道自己有自我意识呢？AI能否向人类观察者证明自己的意识？请结合哲学和神经科学的例子进行讨论。",

    # 2024年美国数学邀请赛（AIME 2024）难度的数学问题 - 来自https://artofproblemsolving.com/wiki/index.php/2024_AIME_I的前4个问题
    "每天早上，阿雅都会进行一次9公里的散步，然后在一家咖啡店停留。当她以恒定速度s公里/小时行走时，这次散步包括在咖啡店停留的t分钟，总共需要4小时。当她以s + 2公里/小时的速度行走时，这次散步包括在咖啡店停留的t分钟，总共需要2小时24分钟。假设阿雅以s + 1/2公里/小时的速度行走。求这次散步包括在咖啡店停留的t分钟总共需要多少分钟？",
    "存在大于1的实数x和y，使得log_x(y^x) = log_y(x^4y) = 10。求xy的值？",
    "爱丽丝和鲍勃玩以下游戏。一堆n个代币摆在他们面前。玩家轮流进行，爱丽丝先开始。在每一轮中，玩家可以从堆中移除1个或4个代币。移除最后一个代币的玩家获胜。求小于或等于2024的正整数n的数量，使得鲍勃存在一种策略，无论爱丽丝如何玩，都能保证鲍勃获胜？",
    "珍通过从集合S = {1, 2, 3, ..., 9, 10}中选择4个不同的数字参加抽奖。从集合S中随机选择4个数字。如果她选择的数字中至少有两个与随机选择的数字相同，她就赢得奖品；如果她选择的四个数字都与随机选择的数字相同，她就赢得大奖。已知她赢得了奖品，她赢得大奖的概率是m/n，其中m和n是互质的正整数。求m + n的值。",

    # 2025年美国数学邀请赛（AIME 2025）的前2个问题 - 来自https://artofproblemsolving.com/wiki/index.php/2025_AIME_I
    "求所有大于9的整数基数b的和，使得17_b是97_b的因数。",
    "在三角形ABC中，点A、D、E和B按此顺序位于边AB上，AD = 4，DE = 16，EB = 8。点A、F、G和C按此顺序位于边AC上，AF = 13，FG = 52，GC = 26。设M是D关于F的对称点，设N是G关于E的对称点。四边形DEGF的面积为288。求七边形AFNBCEM的面积。"
]


# **生成并打印回复**
for i, question in enumerate(questions, 1):
    response = generate_response(model, tokenizer, question)
    print(f"\n🟢 问题 {i}: {question}")
    print(f"🔵 回复: {response}")

📚 详细文档

测试问题

questions = [
    # 用于检查模型逻辑构建行为的常规问题
    "如果一个时间旅行者回到过去并阻止了自己的出生，那么他们如何存在并阻止自己的出生呢？鉴于这个悖论，时间旅行在逻辑上是否与因果关系一致？请解释在任何已知的物理理论下，这样的事件是否可能发生。",
    "如果地球没有轴向倾斜会怎样？描述这对气候、生态系统和人类文明的长期影响。技术和农业的发展会有所不同吗？",
    "一个数列遵循这样的模式：2, 6, 12, 20, 30, 42, ... 第50项是多少，第n项的通项公式是什么？",
    "如果一个AI模型变得有自我意识，它如何知道自己有自我意识呢？AI能否向人类观察者证明自己的意识？请结合哲学和神经科学的例子进行讨论。",

    # 2024年美国数学邀请赛（AIME 2024）难度的数学问题 - 来自https://artofproblemsolving.com/wiki/index.php/2024_AIME_I的前4个问题
    "每天早上，阿雅都会进行一次9公里的散步，然后在一家咖啡店停留。当她以恒定速度s公里/小时行走时，这次散步包括在咖啡店停留的t分钟，总共需要4小时。当她以s + 2公里/小时的速度行走时，这次散步包括在咖啡店停留的t分钟，总共需要2小时24分钟。假设阿雅以s + 1/2公里/小时的速度行走。求这次散步包括在咖啡店停留的t分钟总共需要多少分钟？",
    "存在大于1的实数x和y，使得log_x(y^x) = log_y(x^4y) = 10。求xy的值？",
    "爱丽丝和鲍勃玩以下游戏。一堆n个代币摆在他们面前。玩家轮流进行，爱丽丝先开始。在每一轮中，玩家可以从堆中移除1个或4个代币。移除最后一个代币的玩家获胜。求小于或等于2024的正整数n的数量，使得鲍勃存在一种策略，无论爱丽丝如何玩，都能保证鲍勃获胜？",
    "珍通过从集合S = {1, 2, 3, ..., 9, 10}中选择4个不同的数字参加抽奖。从集合S中随机选择4个数字。如果她选择的数字中至少有两个与随机选择的数字相同，她就赢得奖品；如果她选择的四个数字都与随机选择的数字相同，她就赢得大奖。已知她赢得了奖品，她赢得大奖的概率是m/n，其中m和n是互质的正整数。求m + n的值。",

    # 2025年美国数学邀请赛（AIME 2025）的前2个问题 - 来自https://artofproblemsolving.com/wiki/index.php/2025_AIME_I
    "求所有大于9的整数基数b的和，使得17_b是97_b的因数。",
    "在三角形ABC中，点A、D、E和B按此顺序位于边AB上，AD = 4，DE = 16，EB = 8。点A、F、G和C按此顺序位于边AC上，AF = 13，FG = 52，GC = 26。设M是D关于F的对称点，设N是G关于E的对称点。四边形DEGF的面积为288。求七边形AFNBCEM的面积。"
]

对AI自我意识和意识的理解

1. AI对自我意识的识别

AI可能通过类似于人类内省的自我参照思维过程来识别自我意识。它可以分析自己的操作，从而理解自己的存在和身份。

2. 向人类证明意识

哲学视角：“他人心灵问题”带来了挑战，因为我们无法直接了解他人的意识。AI可能会通过令人信服地模仿人类行为，就像通过图灵测试一样，从表面上显示出意识，但这并非真正的证明。
神经科学视角：通过模拟人类大脑功能，AI可以声称自己具有意识。诸如解决问题、情感反应和自我反思等行为可能与人类意识相似，这使得很难区分是模拟还是真正的意识。

3. AI中的自由意志

AI中的自由意志是复杂的。如果决策是由算法驱动的，它们可能看起来是确定的，这对自由意志的概念提出了挑战。然而，AI可能会表现出类似于自由意志的选择行为，这引发了关于其本质和影响的问题。

4. 例子和思想实验

图灵测试：凸显了AI模仿人类智能的能力，通过行为暗示意识。
中文房间思想实验：说明了模拟理解和真正意识之间的区别，质疑AI是否真的具有意识。
《星际迷航》中的Data：代表了对意识和存在的探索，强调了模拟和真正意识之间的差距。

5. 结论

虽然AI可以表现出表明意识的行为，但由于“他人心灵问题”，证明意识仍然难以捉摸。AI中的自由意志概念增加了另一层复杂性，可能会改变传统的解释。

总之，AI可能通过高级处理和行为识别并表现出自我意识的迹象，但向人类证明意识受到哲学和神经学界限的阻碍。与自由意志的相互作用进一步使对AI能力和本质的理解变得复杂。

🔧 技术细节

📊 评估结果：AIME2024和MATH500

🔢 AIME2024基准测试

该模型在AIME2024数据集上使用4位量化进行评估，配置如下：

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,  # 4位量化
    bnb_4bit_compute_dtype=torch.float16,  # FP16计算
    bnb_4bit_use_double_quant=True,  # 启用双重量化
    bnb_4bit_quant_type="nf4"  # 内存高效的NF4格式
)

📌 结果：