T

Thinkedit Deepseek Qwen 14b

由 cesun 开发
ThinkEdit是一种轻量级权重编辑方法,通过识别并编辑少量注意力头,缓解大语言模型在推理任务中生成过度简短思维链的问题,提升推理准确性。
下载量 46
发布时间 : 3/14/2025

模型简介

该模型基于deepseek-qwen-14b改进,专注于解决推理模型因生成过度简短思维链而导致的准确性下降问题。通过可解释的权重编辑技术,显著提升在数学推理等任务中的表现。

模型特点

轻量级权重编辑
仅编辑总参数的约0.1%,通过修改少量注意力头实现性能提升
简短推理缓解
专门针对模型生成过度简短思维链的问题进行优化
可解释性
能识别约2%的'简短推理'注意力头,编辑方向明确
性能提升
在多个数学推理数据集上显著提升准确率,特别是在简短推理案例中

模型能力

数学问题求解
复杂推理任务处理
思维链生成
教育领域应用

使用案例

教育
数学问题解答
解决小学数学到高中难度的数学问题
在GSM8K数据集上准确率达93.5%
学术评估
用于MMLU小学数学评估
准确率提升至96.53%
研究
模型行为研究
研究大语言模型在推理任务中的行为模式
识别出导致简短推理的特定注意力头
AIbase
智启未来,您的人工智能解决方案智库
简体中文