patricide-12B-Unslop-Mell开源语言模型 - 助力创意写作与角色扮演！

首页

Patricide 12B Unslop Mell

由 redrix 开发

基于SLERP融合法的12B参数语言模型，合并了Mag-Mell和UnslopNemo模型的优势，适用于创意写作和角色扮演场景

大型语言模型

Transformers

开源协议:Apache-2.0 #SLERP融合模型 #角色扮演优化 #创意写作增强

下载量 1,311

发布时间 : 12/1/2024

模型简介

这是通过mergekit工具合并的两个12B参数语言模型的成果，旨在继承原始模型在聊天、角色扮演和创意写作方面的优势。模型采用SLERP融合法，测试显示其具有良好连贯性，但偶现无意义乱码现象。

模型特点

双模型优势融合

通过SLERP方法合并Mag-Mell和UnslopNemo模型的优势，提升生成质量

多模板兼容

支持ChatML和Metharme/Pygmalion两种对话模板格式

量化版本支持

提供多种GGUF量化版本，便于不同硬件环境部署

模型能力

文本生成

对话交互

角色扮演

创意写作

故事创作

使用案例

娱乐应用

角色扮演游戏

作为游戏NPC的对话引擎，提供沉浸式互动体验

测试显示对话连贯性良好

创意写作助手

辅助作者进行故事构思和内容生成

初步测试表现稳定

🚀 弑父者-12B-无卡顿梅洛模型

弑父者-12B-无卡顿梅洛模型是一个基于预训练语言模型合并的成果，旨在继承父模型的优秀特性，为聊天、角色扮演、创意写作等场景提供更稳定和连贯的语言交互体验。

模型信息

属性	详情
基础模型	inflatebot/MN - 12B - Mag - Mell - R1、TheDrummer/UnslopNemo - 12B - v4.1
库名称	transformers
标签	mergekit、merge、12b、chat、roleplay、creative - writing、SLERP
许可证	apache - 2.0
新版本	redrix/patricide - 12B - Unslop - Mell - v2

模型合并背景

“父亲的罪孽，绝不能以这种方式重演。”

本模型是使用 mergekit 合并预训练语言模型的产物。这是我的首次合并尝试，一开始我对如何在配置中编写参数一无所知（更新：我已经搞明白了）。如果有人有更详尽的合并指南，欢迎告知，我也很想深入了解其中的原理。

两个基础模型都有不错的表现，所以我决定将它们合并，期望新模型能继承父模型的优点。（更新：早期测试显示该模型连贯性良好，但有时会输出难以理解的胡言乱语或生造词，这可能是分词器损坏导致的。）

模型测试情况

我在 Q6_K GGUF 量化模型上进行了测试，结果令人满意，因此决定上传。虽然我没有在故事写作和角色扮演场景中进行广泛测试，但结果稳定且至少是连贯的。我在 温度为 1（最后设置温度）和 最小概率为 0.1 的条件下进行了测试。我不清楚 DRY 或 XTC 对输出稳定性的影响，也不知道在高上下文大小下的表现如何。两个父模型都使用 ChatML 模板，尽管 Unslop - Nemo 也使用 Metharme/Pygmalion 模板，我还未测试哪个效果更好。（更新：mergekit 引入了定义模板的功能，我将在后续模型中强制使用 ChatML，以实现全面标准化。）

⚠️ 重要提示

本模型早期测试发现存在输出难以理解内容的情况，可能是分词器损坏导致。

💡 使用建议

可以在不同场景下进行实验，探索模型的最佳使用方式。

模型后续计划

我可能会在能够运行新模型且无需过多调整采样器、参数、文本模板等的情况下发布后续模型。之后会按照 DavidAU 的方法进行广泛测试，以便在开发新模型的同时获得更多反馈。我希望创建在基础状态下就表现出色的模型，通过采样器进一步优化。因此，除非模型基础状态非常有潜力，否则我不会在微调采样器上花费过多时间。

量化模型

静态 GGUF 量化模型：
- redrix/patricide - 12B - Unslop - Mell - GGUF（量化模型数量少于下方链接）
- mradermacher/patricide - 12B - Unslop - Mell - GGUF（感谢提供）
加权/Imatrix GGUF 量化模型：mradermacher/patricide - 12B - Unslop - Mell - i1 - GGUF

合并详情

合并方法

本模型采用 SLERP 合并方法。

合并模型

配置文件

以下是用于生成此模型的 YAML 配置：

models:
  - model: TheDrummer/UnslopNemo-12B-v4.1
  - model: inflatebot/MN-12B-Mag-Mell-R1
merge_method: slerp
base_model: TheDrummer/UnslopNemo-12B-v4.1
dtype: bfloat16
parameters:
  t: [0, 0.5, 1, 0.5, 0]