Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF开源模型

首页

Qwen2.5 Coder 1.5B Instruct Abliterated GGUF

由 bartowski 开发

基于Qwen2.5-Coder-1.5B-Instruct-abliterated模型的Llamacpp imatrix量化版本，适用于代码生成和文本生成任务。

大型语言模型英语开源协议:Apache-2.0 #代码生成优化 #无审查对话 #多级量化适配

下载量 729

发布时间 : 11/13/2024

模型简介

这是一个经过量化的1.5B参数代码生成模型，基于Qwen2.5架构，支持无限制文本生成和聊天功能。

模型特点

多种量化选项

提供从F16到IQ2_M等多种量化版本，适应不同硬件需求

无限制生成

支持去审查的无限制文本生成

ARM优化

提供专门为ARM芯片优化的量化版本

imatrix量化

使用llama.cpp的imatrix选项进行量化，提高量化质量

模型能力

文本生成

代码生成

聊天对话

无限制内容生成

使用案例

编程辅助

代码补全

帮助开发者完成代码片段的编写

内容创作

无限制文本生成

生成各种类型的无审查限制文本内容

🚀 Qwen2.5-Coder-1.5B-Instruct-abliterated的Llamacpp imatrix量化模型

本项目提供了基于llama.cpp对Qwen2.5-Coder-1.5B-Instruct-abliterated模型进行量化的版本。通过量化，能够在不同硬件条件下更高效地运行模型，满足多样化的使用需求。

🚀 快速开始

模型量化

使用 llama.cpp 版本 b4058 进行量化。原始模型可从这里获取。所有量化版本均使用imatrix选项，并采用该数据集进行校准。

运行环境

你可以在 LM Studio 中运行这些量化模型。

提示词格式

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📦 安装指南

安装huggingface-cli

首先，确保你已经安装了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下载指定文件

你可以指定要下载的具体文件：

huggingface-cli download bartowski/Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF --include "Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_M.gguf" --local-dir ./

下载分割文件

如果模型大小超过50GB，它会被分割成多个文件。要将它们全部下载到本地文件夹，请运行：

huggingface-cli download bartowski/Qwen2.5-Coder-1.5B-Instruct-abliterated-GGUF --include "Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0/*" --local-dir ./

你可以指定一个新的本地目录（如Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0），或者直接下载到当前目录（./）。

📚 详细文档

下载文件列表

文件名	量化类型	文件大小	分割情况	描述
Qwen2.5-Coder-1.5B-Instruct-abliterated-f16.gguf	f16	3.56GB	否	完整的F16权重。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q8_0.gguf	Q8_0	1.89GB	否	极高质量，通常不需要，但为最大可用量化。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q6_K_L.gguf	Q6_K_L	1.58GB	否	嵌入和输出权重使用Q8_0。非常高质量，接近完美，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q6_K.gguf	Q6_K	1.46GB	否	非常高质量，接近完美，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_L.gguf	Q5_K_L	1.43GB	否	嵌入和输出权重使用Q8_0。高质量，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_M.gguf	Q5_K_M	1.29GB	否	高质量，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_L.gguf	Q4_K_L	1.29GB	否	嵌入和输出权重使用Q8_0。质量良好，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q5_K_S.gguf	Q5_K_S	1.26GB	否	高质量，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_XL.gguf	Q3_K_XL	1.18GB	否	嵌入和输出权重使用Q8_0。质量较低但可用，适合低内存情况。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_M.gguf	Q4_K_M	1.12GB	否	质量良好，大多数使用场景的默认大小，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_K_S.gguf	Q4_K_S	1.07GB	否	质量略低，但节省空间，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_8_8.gguf	Q4_0_8_8	1.07GB	否	针对ARM推理进行优化。需要'sve'支持（见下面的链接）。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_4_8.gguf	Q4_0_4_8	1.07GB	否	针对ARM推理进行优化。需要'i8mm'支持（见下面的链接）。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0_4_4.gguf	Q4_0_4_4	1.07GB	否	针对ARM推理进行优化。应该在所有ARM芯片上都能良好工作，如果你不确定，可以选择这个。不要在Mac或Windows上使用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q4_0.gguf	Q4_0	1.07GB	否	旧格式，通常不如类似大小的其他格式值得使用
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ4_XS.gguf	IQ4_XS	1.02GB	否	质量不错，比Q4_K_S更小，性能相似，推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_L.gguf	Q3_K_L	0.98GB	否	质量较低但可用，适合低内存情况。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q2_K_L.gguf	Q2_K_L	0.98GB	否	嵌入和输出权重使用Q8_0。质量非常低，但出人意料地可用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_M.gguf	Q3_K_M	0.92GB	否	质量低。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ3_M.gguf	IQ3_M	0.88GB	否	中低质量，新方法，性能与Q3_K_M相当。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q3_K_S.gguf	Q3_K_S	0.86GB	否	质量低，不推荐。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ3_XS.gguf	IQ3_XS	0.83GB	否	质量较低，新方法，性能不错，比Q3_K_S略好。
Qwen2.5-Coder-1.5B-Instruct-abliterated-Q2_K.gguf	Q2_K	0.75GB	否	质量非常低，但出人意料地可用。
Qwen2.5-Coder-1.5B-Instruct-abliterated-IQ2_M.gguf	IQ2_M	0.70GB	否	质量相对较低，使用了最先进的技术，出人意料地可用。