数学编程增强

# 数学编程增强

Deepseek R1 0528 Qwen3 8B GGUF

DeepSeek-R1-0528是DeepSeek R1系列的小版本升级模型，通过增加计算资源和算法优化显著提升了推理深度和能力，在数学、编程等多个基准测试中表现出色。

大型语言模型

Deepseek R1 0528 GPTQ Int4 Int8Mix Compact

DeepSeek-R1-0528模型的GPTQ量化版本，采用Int4 + 选择性Int8的量化方案，在保证生成质量的同时减小文件大小。

大型语言模型

Deepseek R1 0528

DeepSeek R1模型已完成小幅版本升级，当前版本为DeepSeek-R1-0528。在最新更新中，DeepSeek R1通过增加计算资源投入并在后训练阶段引入算法优化机制，显著提升了其深度推理与推断能力。

大型语言模型

Kanana 1.5 8b Instruct 2505

Kanana 1.5是Kanana模型家族的新版本，在编码、数学和函数调用能力方面相比前代有显著提升，支持32K tokens长度并可扩展至128K tokens。

大型语言模型

Transformers 支持多种语言

Sarvam-M是基于Mistral-Small构建的多语言、混合推理、纯文本语言模型，专门针对印度语言和英语进行优化，具备卓越的推理能力和文化适应性。

大型语言模型

Transformers 支持多种语言

Qwen3 0.6B GGUF

Qwen3是通义千问系列最新一代大语言模型，提供完整稠密模型与混合专家（MoE）架构。经过海量训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

大型语言模型

Qwen3是通义千问系列大语言模型的最新版本，提供了一系列密集型和混合专家（MoE）模型。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得了突破性进展。

大型语言模型

Qwen3 30B A3B GGUF

Qwen3是通义千问系列最新一代大语言模型，提供密集型和混合专家（MoE）模型的全面解决方案，在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3 14B GPTQ Int4

Qwen3-4B是通义千问系列最新40亿参数大语言模型，支持思维模式与非思维模式切换，在推理、多语言和智能体任务中表现优异。

大型语言模型

Qwen3-32B是由Qwen团队开发的大语言模型，支持131,072 tokens的上下文长度，具备强大的数学、编程和常识推理能力。

大型语言模型

lmstudio-community

Qwen3 1.7B GGUF

Qwen3-1.7B是由Qwen开发的1.7B参数规模的大语言模型，支持32k tokens超长上下文，擅长创意写作、角色扮演和多轮对话。

大型语言模型

lmstudio-community

Qwen团队推出的8B参数规模大语言模型，支持超长上下文和多种语言处理

大型语言模型

lmstudio-community

Qwen3是通义千问系列大语言模型的最新版本，提供全系列稠密模型和混合专家（MoE）模型，在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3 235B A22B GGUF

Qwen团队推出的2350亿参数大语言模型量化版本，支持131k上下文长度和混合专家架构

大型语言模型

lmstudio-community

Qwen3-4B是通义千问系列大模型的最新版本，提供40亿参数的语言模型，支持思维与非思维模式切换，具备强大的推理、指令遵循和多语言能力。

大型语言模型

M1-32B是基于Qwen2.5-32B-Instruct微调的320亿参数大语言模型，专为提升多智能体系统中的推理、讨论和决策能力而优化。

大型语言模型

Transformers 支持多种语言

Phi 4 Mini Instruct Abliterated

Phi-4-mini-instruct是基于合成数据和精选公开网站构建的轻量级开源模型，专注于高质量、强推理能力的数据。支持128K令牌上下文长度，通过监督微调和直接偏好优化进行增强，以确保精准的指令遵循和安全性。

大型语言模型

Transformers 支持多种语言

Skywork O1 Open Llama 3.1 8B

Skywork o1 Open-Llama-3.1-8B是基于Llama-3.1-8B训练的强力对话模型，通过'慢思考'推理风格数据显著增强推理能力。

大型语言模型

基于CohereForAI/c4ai-command-r-v01架构微调的350亿参数多语言大语言模型，专注长上下文处理与事实型数据生成

大型语言模型

Transformers 支持多种语言

Beyonder 4x7B V2

Beyonder-4x7B-v2是一个基于混合专家模型（MoE）架构的大语言模型，由4个专家模块组成，专注于不同领域的任务，如对话、编程、创意写作和数学推理。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24