Cogito - v1开源混合推理模型，在编程、STEM等多场景应用表现卓越

首页

Cogito V1

由 cortexso 开发

DeepCogito推出的通过迭代蒸馏与放大（IDA）训练的强大混合推理模型，在编程、STEM、多语言和智能体应用场景中表现卓越。

大型语言模型开源协议:Apache-2.0 #迭代蒸馏推理 #混合规模优化 #多模态推理

下载量 4,002

发布时间 : 4/9/2025

模型简介

一套支持标准（直接回答）和推理（自反思）双模式运行的大语言模型，性能显著超越同等规模的开源模型。

模型特点

双模式运行

支持标准（直接回答）和推理（自反思）两种运行模式

高性能

70B版本在基准测试中超越了LLaMA 4 109B MoE模型

量化支持

所有分支默认包含q4-km量化版本

多场景适用

在编程、STEM、多语言和智能体应用场景中表现卓越

模型能力

文本生成

编程辅助

STEM问题解答

多语言处理

智能体应用

使用案例

编程

代码生成

辅助开发者生成高质量代码

提高开发效率

教育

STEM问题解答

帮助学生解决科学、技术、工程和数学问题

提升学习效率

多语言应用

多语言文本处理

处理多种语言的文本生成和理解任务

跨语言沟通辅助

🚀 DeepCogito

DeepCogito 推出了 Cogito-v1 预览版 系列，这是一套强大的混合推理模型，采用迭代蒸馏与放大（IDA）技术进行训练。这些模型旨在通过可扩展的对齐和自我改进策略突破开放权重大语言模型（LLM）的界限，在编码、STEM、多语言和智能体应用场景中展现出卓越的性能。

该系列的每个模型都支持标准（直接回答）和推理（自我反思）两种模式，在性能上显著超越了同等规模的开放模型，如 LLaMA、DeepSeek 和 Qwen。其中，70B 版本在基准测试中明显优于新发布的 LLaMA 4 109B MoE 模型。

🚀 快速开始

你可以通过以下两种方式使用该模型：

使用 Jan（UI）

按照快速入门指南安装 Jan。
在 Jan 模型中心使用：

deepcogito/cognito-v1

使用 Cortex（CLI）

按照快速入门指南安装 Cortex。
使用以下命令运行模型：

cortex run cognito-v1

✨ 主要特性

强大的混合推理能力：采用迭代蒸馏与放大（IDA）技术训练，在多种应用场景中表现出色。
双模式支持：支持标准和推理两种模式，满足不同需求。
卓越的性能：显著超越同等规模的开放模型，70B 版本在基准测试中优于 LLaMA 4 109B MoE 模型。

📦 安装指南

根据你选择的使用方式，分别参考上述快速开始部分的 Jan（UI）或 Cortex（CLI）的安装步骤。

📚 详细文档

模型变体

Cogito-v1 预览版

编号	变体	分支	Cortex CLI 命令
1	Cogito-v1-Preview-LLaMA-3B	3b	`cortex run cognito-v1:3b`
2	Cogito-v1-Preview-LLaMA-8B	8b	`cortex run cognito-v1:8b`
3	Cogito-v1-Preview-Qwen-14B	14b	`cortex run cognito-v1:14b`
4	Cogito-v1-Preview-Qwen-32B	32b	`cortex run cognito-v1:32b`
5	Cogito-v1-Preview-LLaMA-70B	70b	`cortex run cognito-v1:70b`