数学推理优化

# 数学推理优化

Openreasoning Nemotron 32B GGUF

OpenReasoning-Nemotron-32B 是一个基于 Qwen2.5-32B-Instruct 衍生的大型语言模型，专注于数学、代码和科学解决方案生成的推理任务。

大型语言模型

Transformers 支持多种语言

Openreasoning Nemotron 14B GGUF

OpenReasoning-Nemotron-14B 是基于 Qwen2.5-14B-Instruct 开发的大型语言模型，专注于数学、代码和科学推理，支持 64K 令牌的上下文长度。

大型语言模型

Transformers 支持多种语言

Openreasoning Nemotron 1.5B

OpenReasoning-Nemotron-1.5B 是一个基于 Qwen2.5-1.5B-Instruct 的大语言模型，专注于数学、代码和科学解决方案的推理任务。

大型语言模型

Transformers 支持多种语言

Acemath 7B Instruct GGUF

AceMath-7B-Instruct是专为数学推理设计的前沿模型，基于Qwen2.5-Math-7B-Base开发，擅长使用思维链（CoT）推理解决英语数学问题。

大型语言模型英语

Unireason Qwen3 14B RL GGUF

UniReason-Qwen3-14B-RL的静态量化版本，适用于文本生成和数学推理研究场景。

大型语言模型

Transformers 英语

Deepseek R1 0528 Quantized.w4a16

经过量化处理的DeepSeek-R1-0528模型，通过将权重量化为INT4数据类型，显著降低了GPU内存和磁盘空间的需求。

大型语言模型

Mimo 7B RL 0530

MiMo是一系列专为推理任务从头训练的7B参数模型，通过优化预训练和后训练策略，在数学和代码推理任务上表现出色。

大型语言模型

ALP DeepScaleR 1.5B C16K

ALP_DeepScaleR_1.5B_C16K是基于DeepScaleR-1.5B模型，采用自适应长度惩罚（ALP）方法进行训练的模型，能在保持性能的同时显著减少token使用量。

大型语言模型

Multiverse-32B是基于Multiverse构建的首个开源、非自回归模型，在AIME测试中表现优异，具有重要的学术和应用价值。

大型语言模型

Qwen3 30B A3B Quantized.w4a16

Qwen3-30B-A3B的INT4量化版本，通过权重量化减少75%的磁盘和GPU内存需求，保持高性能。

大型语言模型

Phi 4 Mini Reasoning GGUF

Phi-4-mini-reasoning 是一个基于合成数据构建的轻量级开放模型，专注于高质量、富含推理的数据，并针对更高级的数学推理能力进行了进一步微调。

大型语言模型

M1是一个基于Mamba混合架构的3B参数规模模型，专注于数学推理任务，在多项数学竞赛基准测试中表现优异。

大型语言模型

togethercomputer

Phi 4 Reasoning Unsloth Bnb 4bit

Phi-4-reasoning是一款由微软开发的先进推理模型，基于Phi-4进行微调，专注于提升数学、科学和编码等领域的推理能力。

大型语言模型

Transformers 支持多种语言

Phi 4 Reasoning Plus GGUF

Phi-4-reasoning-plus 是由微软研究院开发的开源推理模型，专注于数学、科学和编程领域的高级推理能力。

大型语言模型支持多种语言

Phi 4 Mini Reasoning Unsloth Bnb 4bit

Phi-4-mini-reasoning是一个轻量级的开源模型，专注于数学推理，支持128K令牌的上下文长度，适用于计算资源受限的环境。

大型语言模型

Transformers 支持多种语言

Microsoft Phi 4 Reasoning GGUF

这是微软Phi-4-reasoning模型的量化版本，使用llama.cpp进行优化，适用于推理任务，支持多种量化选项。

大型语言模型

Microsoft Phi 4 Mini Reasoning GGUF

这是微软Phi-4-mini-reasoning模型的量化版本，使用llamacpp工具进行量化处理，旨在提升模型在不同硬件环境下的运行效率和性能。

大型语言模型支持多种语言

MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型，在数学与代码推理任务上达到与OpenAI o1-mini比肩的性能。

大型语言模型

Qwen3 0.6B GGUF

通义千问3 0.6B的量化版本，适用于文本生成任务，支持32k上下文长度和多语言处理。

大型语言模型

lmstudio-community

Nvidia OpenMath Nemotron 14B Kaggle GGUF

这是NVIDIA开源的14B参数数学大语言模型，经过llama.cpp量化处理，可在不同硬件条件下高效运行。

大型语言模型英语

Tngtech.olmo 2 Instruct Math 32B GGUF

OLMo-2-Instruct-Math-32B 是一个专注于数学任务的大型语言模型，由 tngtech 发布。

大型语言模型

Openmath Nemotron 1.5B

OpenMath-Nemotron-1.5B是基于Qwen2.5-Math-1.5B在OpenMathReasoning数据集上微调的数学推理模型，在多个数学基准测试中取得最先进结果。

大型语言模型

Transformers 英语

Zero Mistral 24B

Zero-Mistral-24B是基于Mistral-Small-3.1-24B-Instruct-2503改进的纯文本模型，主要适配俄语和英语，移除了原版的视觉功能，专注于文本生成任务。

大型语言模型

Transformers 支持多种语言

Openmath2 Llama3.1 8B

OpenMath2-Llama3.1-8B 是基于 Llama3.1-8B-Base 模型，使用 OpenMathInstruct-2 数据集微调而成的数学专用模型，在多个数学基准测试中表现优异。

大型语言模型

Transformers 英语

Viper Coder V1.7 Vsm6

Viper-Coder-v1.7-Vsm6是基于千问2.5 14B模态架构设计的大语言模型，专注于提升编码效率和计算推理能力，优化内存使用并减少冗余文本生成。

大型语言模型

Transformers 支持多种语言

Phi 4 Reasoning Plus

Phi-4-reasoning-plus 是微软研究院开发的先进开放权重推理模型，基于 Phi-4 通过监督微调和强化学习优化，专注于数学、科学和编码领域的高级推理能力。

大型语言模型

Transformers 支持多种语言

EZO2.5 Gemma 3 12b It Preview

基于google/gemma-3-12b-it模型，通过EZO训练方法提升日语性能的文本生成模型

大型语言模型

Transformers 日语

Notbad V1 1 Mistral 24b

专注于数学推理和Python编程训练的24B参数大语言模型，基于Mistral架构优化

大型语言模型

Openrs3 GRPO Ja

OpenRS3-GRPO-ja是基于SakanaAI/TinySwallow-1.5B-Instruct模型在日语数学指令数据集上微调的版本，采用GRPO方法训练，专注于数学推理任务。

大型语言模型

Notbad V1 0 Mistral 24b

Notbad v1.0 Mistral 24B 是一款专注于数学和Python编程推理的模型，基于Mistral-Small-24B-Instruct-2501并通过强化学习进一步训练。

大型语言模型

EXAONE Deep 7.8B GGUF

EXAONE Deep系列模型在数学和编程等推理任务中表现出色，7.8B版本优于同规模开源模型，甚至超越某些专有模型。

大型语言模型支持多种语言

Olmo 2 Instruct Math 32B

基于OLMo-2-0325-32B-Instruct模型，使用Open R1数学数据集在AMD MI300X GPU上微调，专注提升数学推理能力

大型语言模型

Transformers 英语

Fastcurl 1.5B Preview

FastCuRL-1.5B-Preview 是一个慢思考推理模型，采用课程引导迭代延长强化学习方法，在数学推理任务上表现优异。

大型语言模型

Transformers 英语

Yixin Distill Qwen 72B 4.5bpw H6 Exl2

基于Qwen2.5-72B通过强化学习蒸馏的高性能数学推理与通用知识处理模型，在数学推理和通用知识任务中表现优异。

大型语言模型支持多种语言

Gemma 3 4b Reasoning

Gemma-3-4b推理是基于Transformer架构的语言模型，采用GRPO方法微调，专注于推理任务优化。

大型语言模型

Transformers 英语

Yixin Distill Qwen 72B

专为数学与通用推理优化的高性能蒸馏模型，基于Qwen2.5-72B通过强化学习提炼而成

大型语言模型支持多种语言

Qwen 2.5 7B Reasoning

基于Qwen/Qwen2.5-7B-Instruct微调的版本，专门针对高级推理任务进行了优化

大型语言模型

Transformers 英语

Sombrero Opus 14B Sm5

基于Qwen 2.5 14B模态架构设计，提升编码效率和计算推理能力的模型

大型语言模型

Transformers 支持多种语言

Tinyr1 32B Preview

Tiny-R1-32B-Preview 是一个基于 Deepseek-R1-Distill-Qwen-32B 的推理模型，专注于数学、代码和科学领域，性能接近完整版 R1 模型。

大型语言模型

Fluentlylm Prinum

流畅语言模型项目的首个独立模型，32.5B参数量的因果语言模型，支持多种语言和任务。

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24