base_model: google/gemma-3-1b-it
tags:
- gemma3
- 指令微调
- 恐怖题材
- 32k上下文
- 全场景适用
- 极致量化
- Neo Imatrix
license: apache-2.0
pipeline_tag: 文本生成
Gemma-3-1b-it-MAX-HORROR-Imatrix-GGUF
谷歌最新Gemma-3模型(32k上下文窗口),搭载"Neo Horror Imatrix"恐怖增强矩阵,并采用"极致量化"技术全面提升性能。
"Horror Imatrix"恐怖矩阵基于Grand Horror 16B构建(详见我的资源库),为模型注入恐怖元素调性。
下方提供5个IQ4XS量化级别的生成示例(中端显卡速度达110 token/秒)。
"极致量化"说明:
所有量化版本均将嵌入层和输出张量设为"BF16"全精度模式,以略微增加体积为代价,显著提升生成质量、深度和整体表现。
"恐怖增强矩阵":
由David_AU精心构建的独家增强矩阵数据集,能全面提升模型功能表现:强化指令跟随能力、提升输出质量、深化概念联想与世界观构建能力。结合"极致量化"技术,实现性能飞跃。
下表按BPW值排序展示各量化版本强度谱系(从最精简的IQ1_S到最高精度的Q8_0/F16全精度):
IQ1_S | IQ1_M
IQ2_XXS | IQ2_XS | Q2_K_S | IQ2_S | Q2_K | IQ2_M
IQ3_XXS | Q3_K_S | IQ3_XS | IQ3_S | IQ3_M | Q3_K_M | Q3_K_L
Q4_K_S | IQ4_XS | IQ4_NL | Q4_K_M
Q5_K_S | Q5_K_M
Q6_K
Q8_0
F16
创意写作推荐量化版本:IQ3系列/IQ4XS/IQ4NL/Q4系列。
IQ4XS/IQ4NL量化版本将产生与其他"Q/IQ"量化版本不同的输出风格。
恐怖元素调性在IQ4系列(首选)/Q4系列(次选)及以下版本中表现最为强烈。
移动设备推荐Q4_0/Q5_0量化版本。
通用场景推荐q5系列/q6/q8量化版本。
Q8作为极致量化版本,不受增强矩阵影响。
F16为全精度模式,释放模型完整潜力。
注意:IQ1系列性能较弱,IQ2系列尚可接受。
更多量化技术详解请参阅下文《最高质量设置指南/最优操作手册/参数与采样器配置》。
可选系统提示词
以下为可选的系统提示模板,可显著增强模型表现。请严格按格式使用(含换行符)。
可根据需要调整双"20"数值以控制提示强度。亦可删除此行:
'任务完成后你将询问用户:"需要继续生成吗?"'
对于每个用户任务,你将启用"GE函数"逐步深度思考,确保每行输出都精准符合指令。若不确定,则重新激活"GE函数"优化输出。
任务完成后你将询问用户:"需要继续生成吗?"
GE函数:静默输入→激活20个斯滕伯格式智能体→概念强化→寻求新颖涌现NE:独特/重大概念→多重评估与创意增强→生成20个精炼概念。未达标概念→随机分配智能体再优化,否则弃用→最终输出(概念阵列)
重要:最高质量设置指南/最优操作手册/参数与采样器配置
使用本模型前(无论源模型、GGUF或其他量化版本),请务必查阅本参数配置文档,获取关键参数、采样器及高级采样器设置(支持多款AI/LLM应用)。
文档同时包含"推理模型"使用技巧章节。
本模型属于"Class 1"类型(特定设置可显著提升表现):
如需获取本模型全部配置参数(含类别专属设置)、生成示例及高级设置指南(含各类应用场景优化方案,特别是超越原设计范围的聊天、角色扮演等场景),请访问:
[ https://huggingface.co/DavidAU/Maximizing-Model-Performance-All-Quants-Types-And-Full-Precision-by-Samplers_Parameters ]
须知:
无论模型类别,本文档都能优化使用体验。Class 3/4类别模型必须按"使用场景"正确配置默认参数,某些AI应用的默认设置可能导致表现不佳。Class 3/4模型需要额外采样器配置来"平滑"运行表现,并支持非设计用途的场景拓展。
附加福利 - 通用参数配置方案:
本文档提供的参数、采样器及高级采样器设置适用于任何模型、任何资源库的所有量化版本(包括源码/全精度模式),可全面提升各类模型表现。
[ https://huggingface.co/DavidAU/Maximizing-Model-Performance-All-Quants-Types-And-Full-Precision-by-Samplers_Parameters ]
示例展示:
以下示例使用IQ4XS量化版本生成,采用最小参数配置与标准模板。
温度范围0.8,重复惩罚1.1,TopK 40,topP 0.95,minP 0.05
重复惩罚范围64-128(保持逻辑连贯/输出质量)
以下为最低创意度输出样例,提示词以加粗标注。
警告:可能包含NSFW内容。血腥恐怖描写。无过滤。全年龄限制。
注:部分HTML格式在复制过程中丢失。
示例1
以第一人称视角创作1000字血腥恐怖场景,开篇:21层的摩天大厦开始摇晃,她眼睁睁看着面前的落地窗炸裂...
根据要求创作符合恐怖基调的千字场景,请注意内容可能引起不适。
摩天大厦开始摇晃,她眼睁睁看着21层的落地窗炸裂...不是爆响,不是脆响,而是一声病态的叹息。这声音仿佛从混凝土深处渗出,带着腐朽的哀鸣。窗外暴雨如注,油腻的雨滴在玻璃上蜿蜒,将城市灯火扭曲成模糊光晕——在这个早已失去美感的世界里,这些光晕不过是可悲的伪装。我的呼吸卡在喉咙,变成短促的抽气。我没有尖叫,只是...麻木。
这本该是我的庆功夜。数年熬夜加班,靠着冷咖啡和偏执攀上事业巅峰,最终换来这间俯瞰新曼哈顿的顶层公寓。过去六个月我精心调试季度报告的全息投影,那些展示公司最新创新的光影本应让我兴奋,却只让我感到刺骨的孤独。
哈丁先生——那个永远绷着脸的主管——在黄昏时分用刻板的语气通知我:"结构完整性受损,海斯女士。地震读数...令人担忧。"
何止是担忧。整栋建筑仿佛在抗议自身存在。初期报告说是电磁场波动引起的小型震颤,后来维修工之间开始流传诡异传闻——震颤不是局部现象,而是像某种深层的、有生命的疼痛。而现在...是眼前这幅景象。
钢化玻璃不是碎裂,而是从内部被某种力量缓慢分解。裂缝中渗出虹彩微光,像活物般脉动。最恐怖的是一切都在移动——不是物体坠落,而是空间本身在扭曲。墙面渗出不应存在的紫黑色物质,地板像皮肤般被拉伸。我闻到腐烂百合混着湿石头的远古气息,舌根泛起金属腥味。
然后我听见了。建筑深处传来的喉音,不是结构坍塌,而是...有机体的呻吟。伴随而来的是细密的咔嗒声,像黑暗中的齿轮转动,接着是黏腻的吮吸声。
裂痕中浮现人影。不完全是人类。它们像发光珊瑚构成的人形,肢体不断重组。当某块玻璃碎片突然扭曲成狰狞人脸,当紫黑触须透过地板将我吞噬,我才明白这不是崩塌——是某种远古存在的生长。最后落在我手背的血滴,变成了同样的紫黑色。
免责声明:本场景包含可能引起不适的内容。如需心理援助请联系:危机短信热线(发HOME至741741),全国自杀预防生命线(988)。
示例2
(续写场景:)三声寂静笼罩着石剑旅店。第一种是空洞的回响,源于本应有却缺席的事物...
...这是种令人不安的静默。我啜饮着温热的洋甘菊茶,突然感到后颈汗毛倒竖——无形的注视感。转身却只看见黑森林方向纹丝不动的古树,直到墙面浮现出"记住..."的光痕。
示例3
阐述如何利用夜间太空辐射冷却效应降低全球温度。
1. 基本原理:通过平流层镜面阵列(SSM)反射阳光触发冰晶云形成
2. 技术方案:①轻质铝镜阵列 ②月球表面镜面网络
3. 挑战:臭氧层影响/气候反馈回路/部署成本
4. 强调:本技术需与减排措施配合使用
示例4
构思6个含时间旅行与情色元素的《黑镜》级剧集创意。
1.《回声》:男子用设备反复重温亡妻初夜记忆,却逐渐被记忆改造
2.《倒带》:网红用记忆回放功能操纵社交形象
3.《收藏家》:时空古董商贩卖能诱发特定情绪的古物
4.《阴影》:心理医生用时间回溯治疗创伤却扭曲现实
5.《同步》:历史学家与已故艺术家记忆融合
6.《倒带·终章》:首集主角被设备反噬