思维链推理

# 思维链推理

Acemath 7B Instruct GGUF

AceMath-7B-Instruct是专为数学推理设计的前沿模型，基于Qwen2.5-Math-7B-Base开发，擅长使用思维链（CoT）推理解决英语数学问题。

大型语言模型英语

Openbuddy R1 0528 Distill Qwen3 32B Preview6 QAT 200K GGUF

OpenBuddy是一款开源的多语言聊天机器人，支持多种语言，能为用户提供多样化的交流体验。

大型语言模型支持多种语言

Gemma 3 1b It Medical O1 Reasoning Finetune 16bit

基于Gemma-3 1B模型微调的医学推理专用模型，支持逐步推理的医学问答

大型语言模型

Transformers 英语

Mmada 8B MixCoT

MMaDA是一类新型的多模态扩散基础模型，在文本推理、多模态理解和文本到图像生成等多个领域表现卓越。

文本生成图像

Deepseek R1 Llama 8B F32 GGUF

DeepSeek-R1-Llama-8B-F32-GGUF 是 DeepSeek-R1-Distill-Llama-8B 的量化版本，采用强化学习直接训练，具备自我验证、反思和生成扩展思维链等能力。

大型语言模型

Transformers 英语

Stockmark 2 VL 100B Beta

Stockmark-2-VL-100B-beta 是一款具有1000亿参数的日语专用视觉语言模型，具备思维链（CoT）推理能力，可用于文档阅读理解。

图像生成文本

Transformers 支持多种语言

Sarvamai Sarvam M GGUF

这是Sarvam-m模型的量化版本，支持多种印度语言和英语的文本生成任务。

大型语言模型支持多种语言

Qwenstoryteller I1 GGUF

QwenStoryteller是一个基于视觉语言模型的讲故事模型，专注于视觉叙事和跨帧一致性。

图像生成文本英语

Qwenstoryteller GGUF

基于Qwen的视觉叙事模型量化版本，专注于跨帧一致的故事生成和图像转文本任务

图像生成文本英语

N1 是由 GoofyLM 开发的一个小型实验性思维链（COT）模型，基于 LLaMA 架构构建，专注于逐步推理问题。

大型语言模型

Transformers 英语

Qwen3 235B A22B AWQ

Qwen3-235B-A22B是Qwen系列最新一代的大语言模型，采用混合专家(MoE)架构，具有2350亿参数和220亿激活参数，在推理、指令遵循、代理能力和多语言支持方面表现卓越。

大型语言模型

cognitivecomputations

MAI-DS-R1 是 DeepSeek-R1 推理模型，经过微软 AI 团队的后续训练，以提升其在受限话题上的响应能力并优化其风险表现，同时保持其推理能力和竞争性能。

大型语言模型

Videochat R1 7B Caption

VideoChat-R1_7B_caption 是一个基于 Qwen2-VL-7B-Instruct 的多模态视频文本生成模型，专注于视频内容理解和描述生成。

视频生成文本

Transformers 英语

Hicoder R1 Distill Gemma 27B

基于谷歌Gemma-3 27B微调的大型语言模型，专注思维链推理和代码生成任务，优化了GPU显存和系统内存管理。

大型语言模型

UIGEN-T1.5是基于Qwen2.5-Coder-32B-Instruct微调的先进Transformer UI生成模型，专门用于生成现代且独特的前端用户界面。

大型语言模型

Transformers 英语

基于Qwen2.5-Coder-7B-Instruct微调的高级UI生成模型，擅长生成现代且视觉吸引人的HTML/CSS代码。

大型语言模型

Transformers 英语

基于Qwen2.5-Coder-14B-Instruct微调的高级Transformer界面生成模型，擅长生成现代且独特的前端用户界面

大型语言模型

Transformers 英语

Deepseek R1 14b Cot Math Reasoning Full GGUF

14B参数规模的数学推理大语言模型，支持思维链推理

大型语言模型

Deephermes 3 Llama 3 3B Preview Abliterated

DeepHermes 3预览版Abliterated是Nous Research旗舰级Hermes系列大语言模型的最新版本，整合了推理与常规LLM响应模式。

大型语言模型

Transformers 英语

Gemma 3 4b Reasoning

Gemma-3-4b推理是基于Transformer架构的语言模型，采用GRPO方法微调，专注于推理任务优化。

大型语言模型

Transformers 英语

TraceBack 12b 是基于 Mistral-Nemo-Instruct 架构的 4bit 量化版本，专注于指令遵循和思维链推理任务。

大型语言模型

Tifa DeepsexV2 7b MGRPO Safetensors GGUF

Tifa-DeepsexV2-7b-MGRPO-safetensors 是一个基于 transformers 库的多语言（中文和英语）大语言模型，经过增量预训练、监督微调和强化学习优化，适用于角色扮演和思维链任务。

大型语言模型支持多种语言

Vikhr YandexGPT 5 Lite 8B It

基于YandexGPT-5-Lite-8B-pretrain的指令模型，通过俄语数据集GrandMaster-PRO-MAX和Grounded-RAG-RU-v2进行SFT训练，擅长俄语和英语任务。

大型语言模型

Transformers 支持多种语言

Acemath 72B Instruct

AceMath 是一系列专为数学推理设计的前沿模型，基于 Qwen 改进，擅长使用思维链（CoT）推理解决英文数学问题。

大型语言模型

Safetensors 英语

Llama3.1 Korean V0.1 Sft By Aidx

基于Llama3.1 instruct基础模型开发，专为韩语及韩国多元文化场景优化的文本生成模型

大型语言模型

Safetensors 支持多种语言

MD Judge V0 2 Internlm2 7b

基于internlm2-7b-chat微调的安全防护工具，提供人类可读的判定解释和细粒度危害评分

大型语言模型

Transformers 英语

Flan T5 Tsa Thor Xl

基于Flan-T5-XL微调的目标情感分析模型，采用三跳推理思维链(THoR)框架训练，专为英文文本设计

大型语言模型

Transformers 英语

Llama 3 Cat 8b Instruct V1

基于llama 3 8b的微调模型，专注于系统提示的忠实度、帮助性和角色沉浸感

大型语言模型

Spyazweb AI DeepMind Project

基于Mixtral架构的多功能大语言模型，融合深度心智与自我优化能力，支持多语言文本生成与复杂推理任务

大型语言模型

Transformers 英语

基于Meta的Llama-3构建的8B参数模型，使用贝果数据集微调，采用单一的llama-3指令格式。

大型语言模型

Quietstar 8 Ahead

基于Mistral-7b模型，采用Quiet-STaR方法进行持续预训练，在生成每个输出词元前会先生成8个思维词元，提升推理能力。

大型语言模型

Nli Entailment Verifier Xxl

基于flan-t5-xxl微调的NLI模型，用于验证前提是否支持假设，特别优化多句前提场景

大型语言模型

Transformers 英语

Synthia V3.0 11B

SynthIA-v3.0-11B是一款通用大语言模型，基于SynthIA-v3.0数据集训练，支持思维树推理和长对话。

大型语言模型

Synthia 70B V1.5

Synthia-70B-v1.5是一个700亿参数的大型语言模型，基于Llama2架构构建，专注于通过思维树方法进行复杂推理和连贯回答。

大型语言模型

Llemma 34B是一个专注于数学领域的语言模型，基于Code Llama 34B的权重进行初始化，并在Proof-Pile-2数据集上训练了500亿个token。

大型语言模型

Transformers 英语

Synthia 70B V1.2b

SynthIA（合成智能代理）是基于Orca风格数据集训练的LLama-2-70B模型，擅长遵循指令及进行长对话。

大型语言模型

Transformers 英语

Minotaur 13b Fixed

Minotaur 13B是基于LlaMA-13B进行指令微调的模型，使用完全开源数据集进行微调，确保可复现性。

大型语言模型

openaccess-ai-collective

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24