PocketDoc_Dans-PersonalityEngine开源大模型 - 多语言适用多场景任务创作

首页

Pocketdoc Dans PersonalityEngine V1.3.0 24b GGUF

由 bartowski 开发

一个多语言、多用途的大型语言模型，支持多种专业领域和通用任务，适用于角色扮演、故事创作、编程等多种场景。

大型语言模型开源协议:Apache-2.0 #多领域文本生成 #高精度量化 #角色扮演优化

下载量 2,543

发布时间 : 5/23/2025

模型简介

Dans-PersonalityEngine是一个24B参数的大型语言模型，支持多种语言和专业领域，包括编程、法律、医学、金融等。模型经过量化处理，可在多种硬件上高效运行。

模型特点

多语言支持

支持9种语言，包括英语、阿拉伯语、德语、法语、西班牙语、印地语、葡萄牙语、日语和韩语。

多领域适用

涵盖通用用途、角色扮演、故事创作、化学、生物学、编程、气候、法律、医学、金融等多个领域。

高效量化

提供多种量化版本，从BF16到极低比特量化，适应不同硬件需求，优化运行效率。

广泛数据集

基于多个高质量数据集训练，包括PocketDoc和AquaV系列数据集，覆盖多种应用场景。

模型能力

文本生成

角色扮演

故事创作

编程辅助

法律咨询

医学问答

金融分析

多语言翻译

使用案例

创意写作

故事创作

生成连贯、富有创意的故事内容

高质量的故事文本，适合小说、剧本等创作

角色扮演

模拟不同角色的对话和行为

生动的角色互动体验

专业领域

编程辅助

生成代码片段或解决编程问题

准确的代码示例和解决方案

法律咨询

提供法律相关的信息和建议

专业的法律知识回答

教育

数学问题解答

解决数学问题和提供解题步骤

清晰的数学问题解答过程

科学知识问答

回答化学、生物学等科学领域的问题

准确的专业知识回答

🚀 PocketDoc的Dans-PersonalityEngine-V1.3.0-24b的Llamacpp imatrix量化模型

本项目是对PocketDoc的Dans-PersonalityEngine-V1.3.0-24b模型进行的Llamacpp imatrix量化处理。该模型支持多种语言，适用于通用目的、角色扮演、故事写作等多个领域。

🚀 快速开始

使用 llama.cpp 的 b5466 版本进行量化。
原始模型地址：https://huggingface.co/PocketDoc/Dans-PersonalityEngine-V1.3.0-24b
所有量化模型均使用imatrix选项和来自此处的数据集生成。
可以在 LM Studio 中运行这些量化模型。
也可以直接使用 llama.cpp 或任何基于llama.cpp的项目来运行。

✨ 主要特性

多语言支持：支持英语、阿拉伯语、德语、法语、西班牙语、印地语、葡萄牙语、日语、韩语等多种语言。
多领域适用：适用于通用目的、角色扮演、故事写作、化学、生物学、代码、气候等多个领域。
多种量化类型：提供了多种量化类型的模型文件，可根据需求选择不同的文件。

📦 安装指南

使用huggingface-cli下载

首先，确保你已经安装了huggingface-cli：

pip install -U "huggingface_hub[cli]"

然后，你可以指定要下载的特定文件：

huggingface-cli download bartowski/PocketDoc_Dans-PersonalityEngine-V1.3.0-24b-GGUF --include "PocketDoc_Dans-PersonalityEngine-V1.3.0-24b-Q4_K_M.gguf" --local-dir ./

如果模型大小超过50GB，它会被分割成多个文件。要将它们全部下载到本地文件夹，请运行：

huggingface-cli download bartowski/PocketDoc_Dans-PersonalityEngine-V1.3.0-24b-GGUF --include "PocketDoc_Dans-PersonalityEngine-V1.3.0-24b-Q8_0/*" --local-dir ./

你可以指定一个新的本地目录（如PocketDoc_Dans-PersonalityEngine-V1.3.0-24b-Q8_0），也可以将它们全部下载到当前目录（./）。

💻 使用示例

提示格式

[gMASK]<sop><|system|>{system_prompt}<|endoftext|><|user|>{prompt}<|endoftext|><|assistant|>

📚 详细文档

模型文件下载

文件名	量化类型	文件大小	分割情况	描述
Dans-PersonalityEngine-V1.3.0-24b-bf16.gguf	bf16	47.15GB	false	完整的BF16权重。
Dans-PersonalityEngine-V1.3.0-24b-Q8_0.gguf	Q8_0	25.05GB	false	极高质量，通常不需要，但提供了最大可用的量化。
Dans-PersonalityEngine-V1.3.0-24b-Q6_K_L.gguf	Q6_K_L	19.67GB	false	嵌入和输出权重使用Q8_0。非常高质量，接近完美，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q6_K.gguf	Q6_K	19.35GB	false	非常高质量，接近完美，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q5_K_L.gguf	Q5_K_L	17.18GB	false	嵌入和输出权重使用Q8_0。高质量，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q5_K_M.gguf	Q5_K_M	16.76GB	false	高质量，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q5_K_S.gguf	Q5_K_S	16.30GB	false	高质量，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q4_1.gguf	Q4_1	14.87GB	false	旧格式，性能与Q4_K_S相似，但在Apple硅芯片上每瓦处理的令牌数有所提高。
Dans-PersonalityEngine-V1.3.0-24b-Q4_K_L.gguf	Q4_K_L	14.83GB	false	嵌入和输出权重使用Q8_0。质量良好，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q4_K_M.gguf	Q4_K_M	14.33GB	false	质量良好，是大多数用例的默认大小，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q4_K_S.gguf	Q4_K_S	13.55GB	false	质量略低，但节省更多空间，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q4_0.gguf	Q4_0	13.49GB	false	旧格式，可为ARM和AVX CPU推理提供在线重新打包。
Dans-PersonalityEngine-V1.3.0-24b-IQ4_NL.gguf	IQ4_NL	13.47GB	false	与IQ4_XS相似，但略大。可为ARM CPU推理提供在线重新打包。
Dans-PersonalityEngine-V1.3.0-24b-Q3_K_XL.gguf	Q3_K_XL	12.99GB	false	嵌入和输出权重使用Q8_0。质量较低但可用，适合低内存情况。
Dans-PersonalityEngine-V1.3.0-24b-IQ4_XS.gguf	IQ4_XS	12.76GB	false	质量不错，比Q4_K_S小，性能相似，推荐。
Dans-PersonalityEngine-V1.3.0-24b-Q3_K_L.gguf	Q3_K_L	12.40GB	false	质量较低但可用，适合低内存情况。
Dans-PersonalityEngine-V1.3.0-24b-Q3_K_M.gguf	Q3_K_M	11.47GB	false	质量较低。
Dans-PersonalityEngine-V1.3.0-24b-IQ3_M.gguf	IQ3_M	10.65GB	false	中低质量，新方法，性能与Q3_K_M相当。
Dans-PersonalityEngine-V1.3.0-24b-Q3_K_S.gguf	Q3_K_S	10.40GB	false	质量较低，不推荐。
Dans-PersonalityEngine-V1.3.0-24b-IQ3_XS.gguf	IQ3_XS	9.91GB	false	质量较低，新方法，性能不错，略优于Q3_K_S。
Dans-PersonalityEngine-V1.3.0-24b-Q2_K_L.gguf	Q2_K_L	9.55GB	false	嵌入和输出权重使用Q8_0。质量非常低，但出人意料地可用。
Dans-PersonalityEngine-V1.3.0-24b-IQ3_XXS.gguf	IQ3_XXS	9.28GB	false	质量较低，新方法，性能不错，与Q3量化相当。
Dans-PersonalityEngine-V1.3.0-24b-Q2_K.gguf	Q2_K	8.89GB	false	质量非常低，但出人意料地可用。
Dans-PersonalityEngine-V1.3.0-24b-IQ2_M.gguf	IQ2_M	8.11GB	false	质量相对较低，使用了最先进的技术，出人意料地可用。
Dans-PersonalityEngine-V1.3.0-24b-IQ2_S.gguf	IQ2_S	7.48GB	false	质量较低，使用了最先进的技术，可用。
Dans-PersonalityEngine-V1.3.0-24b-IQ2_XS.gguf	IQ2_XS	7.21GB	false	质量较低，使用了最先进的技术，可用。

嵌入/输出权重

部分量化模型（如Q3_K_XL、Q4_K_L等）采用了标准量化方法，将嵌入和输出权重量化为Q8_0，而不是默认值。

ARM/AVX信息

以前，你会下载Q4_0_4_4/4_8/8_8，这些模型的权重会在内存中交错排列，以便通过一次加载更多数据来提高ARM和AVX机器的性能。

然而，现在有了一种名为“在线重新打包”的权重处理方法，详情见此PR。如果你使用Q4_0，并且你的硬件可以从重新打包权重中受益，它将自动实时进行处理。

从llama.cpp构建版本 b4282 开始，你将无法运行Q4_0_X_X文件，而需要使用Q4_0。

此外，如果你想获得略高的质量，可以使用IQ4_NL，这得益于此PR，它也会为ARM重新打包权重，不过目前仅适用于4_4。加载时间可能会更长，但总体速度会提高。

选择合适的文件

点击查看详情

Artefact2在此处提供了一篇很棒的文章，带有展示各种性能的图表。

首先，你需要确定你可以运行多大的模型。为此，你需要了解你有多少系统内存（RAM）和/或显存（VRAM）。

如果你希望模型运行得尽可能快，你需要将整个模型放入GPU的显存中。选择一个文件大小比你的GPU总显存小1 - 2GB的量化模型。

如果你追求绝对最高质量，将你的系统内存和GPU的显存相加，然后选择一个文件大小比该总和小1 - 2GB的量化模型。

接下来，你需要决定是使用“I量化”还是“K量化”。

如果你不想考虑太多，选择一个K量化模型。这些模型的格式为“QX_K_X”，如Q5_K_M。

如果你想深入了解，你可以查看这个非常有用的特性图表：

llama.cpp特性矩阵

但基本上，如果你目标是低于Q4的量化，并且你使用的是cuBLAS（Nvidia）或rocBLAS（AMD），你应该考虑I量化模型。这些模型的格式为IQX_X，如IQ3_M。它们是较新的模型，在相同大小下提供更好的性能。

这些I量化模型也可以在CPU上使用，但速度会比同等的K量化模型慢，所以你需要在速度和性能之间做出权衡。

🔧 技术细节

Q4_0_X_X信息（已弃用）

保留此部分是为了展示使用带有在线重新打包的Q4_0在理论上可能的性能提升。

点击查看AVX2系统（EPYC7702）上的基准测试

模型	大小	参数	后端	线程数	测试类型	每秒令牌数	与Q4_0相比的百分比
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp512	204.03 ± 1.03	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp1024	282.92 ± 0.19	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp2048	259.49 ± 0.44	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg128	39.12 ± 0.27	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg256	39.31 ± 0.69	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg512	40.52 ± 0.03	100%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp512	301.02 ± 1.74	147%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp1024	287.23 ± 0.20	101%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp2048	262.77 ± 1.81	101%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg128	18.80 ± 0.99	48%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg256	24.46 ± 3.04	83%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg512	36.32 ± 3.59	90%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp512	271.71 ± 3.53	133%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp1024	279.86 ± 45.63	100%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp2048	320.77 ± 5.00	124%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg128	43.51 ± 0.05	111%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg256	43.35 ± 0.09	110%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg512	42.60 ± 0.31	105%