推理优化

# 推理优化

Nvidia.openreasoning Nemotron 1.5B GGUF

这是一个基于nvidia/OpenReasoning-Nemotron-1.5B的量化版本模型，旨在提供高效的文本生成能力。

大型语言模型

Openreasoning Nemotron 14B GGUF

这是英伟达OpenReasoning Nemotron 14B的量化版本，由bartowski基于llama.cpp提供GGUF量化。

大型语言模型

lmstudio-community

Openreasoning Nemotron 32B Q4 K M GGUF

本模型是从nvidia/OpenReasoning-Nemotron-32B转换而来的GGUF格式模型，可借助llama.cpp进行使用。

大型语言模型

Transformers 支持多种语言

Nvidia AceReason Nemotron 7B GGUF

AceReason-Nemotron-7B 是一个基于 Nemotron 架构的 7B 参数规模的大型语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

Nvidia AceReason Nemotron 14B GGUF

AceReason-Nemotron-14B 是一个14B参数规模的大型语言模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

Llama-3.1-Nemotron-Nano-4B-v1.1是一款基于Llama 3.1优化的大语言模型，在准确性和效率间取得良好平衡，适用于AI代理、聊天机器人等多种场景。

大型语言模型

Transformers 英语

Llama 3.1 Nemotron Nano 4B V1.1

Llama-3.1-Nemotron-Nano-4B-v1.1 是一个基于Llama 3.1 8B压缩而来的大型语言模型，优化了推理能力和任务执行效率，适用于单块RTX显卡本地运行。

大型语言模型

Transformers 英语

Mimo 7B RL Zero

MiMo-7B 是小米推出的专为推理任务设计的语言模型系列，包括基础模型、SFT模型和RL模型，在数学和代码推理任务上表现优异。

大型语言模型

MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型，在数学与代码推理任务上表现出色，性能媲美OpenAI o1-mini。

大型语言模型

小米推出的7B参数规模推理专用语言模型系列，通过优化预训练和后训练策略显著提升数学与代码推理能力

大型语言模型

Thinkedit Deepseek Qwen 14b

ThinkEdit是一种轻量级权重编辑方法，通过识别并编辑少量注意力头，缓解大语言模型在推理任务中生成过度简短思维链的问题，提升推理准确性。

大型语言模型

Qwq 32B FP8 Dynamic

QwQ-32B的FP8量化版本，通过动态量化技术减少50%存储和内存需求，同时保持99.75%的原模型精度

大型语言模型

Cognitivecomputations Dolphin3.0 R1 Mistral 24B GGUF

Dolphin3.0-R1-Mistral-24B 是一个基于 Mistral 架构的 24B 参数大语言模型，由 Eric Hartford 训练，专注于推理和第一性原理分析。

大型语言模型英语

Llama3 Aloe 8B Alpha

Aloe是新一代医疗大语言模型家族，通过模型融合和先进的提示策略，在其规模范围内与所有先前开源模型相比具有高度竞争力，并达到了最先进的成果。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24