D

Deepseek R1 0528 Qwen3 8B GPTQ Int4 Int8Mix

由 QuantTrio 开发
基于DeepSeek-R1-0528-Qwen3-8B开发的量化版本模型,在推理能力、减少幻觉率等方面有显著提升,适用于多种自然语言处理任务。
下载量 154
发布时间 : 5/30/2025

模型简介

该模型通过增加计算资源和引入算法优化机制,显著提升了推理深度和推理能力,适用于数学、编程和通用逻辑等领域。

模型特点

推理能力增强
在各种基准评估中表现出色,包括数学、编程和通用逻辑等领域,整体性能接近领先模型。
准确率提高
在AIME 2025测试中,准确率从之前版本的70%提高到当前版本的87.5%。
幻觉率降低
减少了模型产生幻觉的概率。
功能调用支持增强
更好地支持函数调用。
编码体验优化
提供了更好的编码体验。

模型能力

文本生成
数学推理
编程辅助
逻辑推理
函数调用

使用案例

数学
AIME 2025测试
在AIME 2025测试中,准确率达到87.5%。
准确率从70%提升至87.5%
编程
LiveCodeBench测试
在LiveCodeBench (2408-2505)测试中,Pass@1达到73.3%。
Pass@1从63.5%提升至73.3%
AIbase
智启未来,您的人工智能解决方案智库
简体中文