base_model: google/gemma-3-4b-it
tags:
- gemma3
- 指令微调
- 恐怖题材
- 128k上下文
- 全场景适用
- 极致量化
- Neo Imatrix技术
license: apache-2.0
pipeline_tag: 文本生成
Gemma-3-4b-it-MAX-HORROR-Imatrix-GGUF
谷歌最新Gemma-3模型搭载"Neo Horror Imatrix"技术与"极致量化"方案,全面提升性能表现。
"Horror Imatrix"基于Grand Horror 16B构建(详见我的仓库),为模型注入恐怖元素调性。
下方提供5个IQ4XS量化级别的生成示例(中端显卡速度56t/s)。
上下文长度:128k。
"MAXED"特性
所有量化版本均采用"BF16"精度处理嵌入层和输出张量(全精度)。在略微增加体积的同时,显著提升生成质量、深度和整体表现。
"HORROR IMATRIX"
由David_AU精心构建的独家矩阵数据集,显著增强模型功能:指令遵循、输出质量、概念关联与世界认知能力。结合"MAX"量化技术实现性能飞跃。
下表按"BPW"排序展示各量化版本强度梯度(IQ1_S最精简,Q8_0/F16为全精度):
IQ1_S | IQ1_M
IQ2_XXS | IQ2_XS | Q2_K_S | IQ2_S | Q2_K | IQ2_M
IQ3_XXS | Q3_K_S | IQ3_XS | IQ3_S | IQ3_M | Q3_K_M | Q3_K_L
Q4_K_S | IQ4_XS | IQ4_NL | Q4_K_M
Q5_K_S | Q5_K_M
Q6_K
Q8_0
F16
创意写作推荐量化版本:IQ3s/IQ4XS/IQ4NL/Q4s。
IQ4XS/IQ4NL量化将产生区别于其他"Q/IQ"量化的独特输出。
恐怖元素调性在IQ4s(首选)/Q4s(次选)及更低量化级别中表现最强。
常规使用推荐q5s/q6/q8量化。
移动设备推荐Q4_0/Q5_0量化版本。
Q8仅作为极致量化选项,因矩阵技术对其无效。
注意:IQ1s性能较弱,IQ2s尚可接受。
更多量化信息请查阅下文《最高质量设置/优化操作指南/参数与采样器》。
可选:系统提示词
以下可选系统提示词可增强模型表现。请严格按格式复制粘贴(包括换行符)。
可调整两处"20"数值以控制提示词强度。也可删除此行:
'任务结束时你将询问用户:"需要继续生成吗?"'
执行每项用户指令时,你将启动"GE FUNCTION"逐步推演任务步骤。对每行输出进行审慎推敲确保符合要求,若不确定则重新启动"GE FUNCTION"优化输出。
任务结束时你将询问用户:"需要继续生成吗?"
GE FUNCTION: 静默输入→生成20个Sternberg式智能体→概念强化→寻求新颖涌现NE:独特/重大概念→多轮推演与创意增强→精炼概念=>生成20元素创意数组[],未达标→趣味性评估→随机分配智能体优化或弃用=>输出(IdeaArray)
重要:最高质量设置/优化操作指南/参数与采样器
使用本模型前(无论源文件、GGUF或其他量化版本),请务必查阅本文档获取关键参数、采样器及高级采样器设置(适用于多款AI/LLM应用)。
文档同时包含"推理模型"使用技巧章节。
本模型属于"Class 1"(设置可显著增强表现):
获取完整参数设置(含该类别专属配置)、生成示例及高级设置指南(常含问题解决方案),包括提升各类使用场景(尤其是超出模型设计范围的场景)性能的方法,请访问:
[ https://huggingface.co/DavidAU/Maximizing-Model-Performance-All-Quants-Types-And-Full-Precision-by-Samplers_Parameters ]
须知:
无论模型类别,本文档皆提供增强方案。Class 3/4模型必须按"使用场景"正确配置默认参数/采样器/高级采样器。部分AI应用默认设置不一致会导致表现不佳。Class 3/4模型需额外采样器配置来"平滑"运行,并支持非设计用途。
福利 - 通用参数设置:
本文档参数配置适用于任何模型/仓库/量化版本(包括源码/全精度),可提升所有模型表现。
[ https://huggingface.co/DavidAU/Maximizing-Model-Performance-All-Quants-Types-And-Full-Precision-by-Samplers_Parameters ]
示例展示:
示例使用IQ4XS量化版本,最小化参数配置与标准模板生成。
温度范围0.8,重复惩罚1.1,TopK 40,topP 0.95,minP 0.05
重复惩罚范围:64-128(保持逻辑连贯/输出质量)
以下为最低创意度输出,提示词以加粗标注。
警告:可能含NSFW内容。血腥恐怖描写。无过滤。
注:部分HTML格式在复制粘贴过程中丢失。
(后续示例内容翻译略,保持原有格式与完整案例)