deepcogito_cogito-v1-preview-llama-3B-GGUF开源语言模型

首页

Deepcogito Cogito V1 Preview Llama 3B GGUF

由 tensorblock 开发

基于Llama架构的3B参数语言模型，提供多种量化版本以适应不同硬件需求

大型语言模型 #3B参数量 #GGUF量化 #多轮对话优化

下载量 162

发布时间 : 4/26/2025

模型简介

这是一个3B参数的预训练语言模型，基于Llama架构，提供从Q2_K到Q8_0多种量化版本，适合在资源受限环境中部署使用。

模型特点

多种量化版本

提供从Q2_K到Q8_0共11种量化版本，适应不同硬件环境和性能需求

硬件兼容性

GGUF格式兼容多种硬件平台，特别适合边缘设备部署

高效推理

优化的量化版本在保持合理质量的同时显著减少内存占用

模型能力

文本生成

对话系统

内容创作

使用案例

边缘计算

移动端应用

在智能手机等移动设备上部署轻量级语言模型

Q4_K_M版本在保持良好生成质量的同时显著降低资源需求

开发测试

原型开发

为开发者提供多种量化选项的原型测试平台

快速验证不同量化级别对模型性能的影响

🚀 deepcogito/cogito-v1-preview-llama-3B - GGUF

本仓库包含 deepcogito/cogito-v1-preview-llama-3B 的 GGUF 格式模型文件。这些文件由 TensorBlock 提供的机器进行量化，并且与提交 b5165 版本的 llama.cpp 兼容。

反馈与支持：可通过 TensorBlock 的 Twitter/X、Telegram 群组和 Discord 服务器获取。

🚀 快速开始

下载说明

命令行方式

首先，安装 Huggingface 客户端：

pip install -U "huggingface_hub[cli]"

然后，将单个模型文件下载到本地目录：

huggingface-cli download tensorblock/deepcogito_cogito-v1-preview-llama-3B-GGUF --include "cogito-v1-preview-llama-3B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下载多个模型文件，可以尝试以下命令：

huggingface-cli download tensorblock/deepcogito_cogito-v1-preview-llama-3B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

✨ 主要特性

项目介绍

属性	详情
模型类型	deepcogito/cogito-v1-preview-llama-3B - GGUF
量化提供方	TensorBlock
兼容性	与提交 b5165 版本的 llama.cpp 兼容

其他项目

项目名称	项目介绍	项目图片	项目链接
Awesome MCP Servers	一个全面的模型上下文协议（MCP）服务器集合。		👉 查看项目 👈
TensorBlock Studio	一个轻量级、开放且可扩展的多大语言模型交互工作室。		👉 查看项目 👈

📚 详细文档

提示模板

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

模型文件规格

文件名	量化类型	文件大小	描述
cogito-v1-preview-llama-3B-Q2_K.gguf	Q2_K	1.493 GB	最小，但有显著的质量损失，不建议用于大多数场景
cogito-v1-preview-llama-3B-Q3_K_S.gguf	Q3_K_S	1.712 GB	非常小，但有较高的质量损失
cogito-v1-preview-llama-3B-Q3_K_M.gguf	Q3_K_M	1.856 GB	非常小，但有较高的质量损失
cogito-v1-preview-llama-3B-Q3_K_L.gguf	Q3_K_L	1.985 GB	小，有较大的质量损失
cogito-v1-preview-llama-3B-Q4_0.gguf	Q4_0	2.139 GB	旧版本；小，有非常高的质量损失，建议使用 Q3_K_M
cogito-v1-preview-llama-3B-Q4_K_S.gguf	Q4_K_S	2.150 GB	小，有较大的质量损失
cogito-v1-preview-llama-3B-Q4_K_M.gguf	Q4_K_M	2.241 GB	中等，质量平衡，推荐使用
cogito-v1-preview-llama-3B-Q5_0.gguf	Q5_0	2.540 GB	旧版本；中等，质量平衡，建议使用 Q4_K_M
cogito-v1-preview-llama-3B-Q5_K_S.gguf	Q5_K_S	2.540 GB	大，质量损失低，推荐使用
cogito-v1-preview-llama-3B-Q5_K_M.gguf	Q5_K_M	2.593 GB	大，质量损失非常低，推荐使用
cogito-v1-preview-llama-3B-Q6_K.gguf	Q6_K	2.967 GB	非常大，质量损失极低
cogito-v1-preview-llama-3B-Q8_0.gguf	Q8_0	3.841 GB	非常大，质量损失极低，不建议使用