Starcannon-Unleashed-12B-v1.0开源模型 - 免费部署强化长文本与角色扮演生成

首页

Starcannon Unleashed 12B V1.0

由 VongolaChouko 开发

Starcannon-Unleashed-12B-v1.0是一个合并模型，结合了Starcannon v3和NemoMix Unleashed 12B的优点，旨在提升长文本生成和角色扮演能力。

大型语言模型

Transformers

#长文本角色扮演 #多轮对话优化 #ChatML兼容

下载量 52

发布时间 : 10/29/2024

模型简介

该模型通过合并两个优秀的12B参数模型，结合了角色扮演的深度表现力和长文本生成的稳定性，特别适合创意写作和角色对话场景。

模型特点

长文本稳定性

继承了NemoMix Unleashed的长文本处理能力，在超过24K上下文长度下仍能保持连贯性

角色深度表现

融合Starcannon v3的角色扮演优势，能生动表现角色性格特征

多格式支持

兼容ChatML和Mistral格式，提供灵活的对话交互方式

模型能力

长文本生成

角色扮演对话

创意写作

故事续写

上下文理解

使用案例

创意写作

角色对话生成

生成符合角色性格特征的对话内容

能产生自然、符合角色设定的对话

故事续写

基于已有情节继续发展故事

保持情节连贯性和角色一致性

互动娱乐

角色扮演游戏

作为游戏NPC的对话引擎

提供沉浸式的角色互动体验

🚀 Starcannon-Unleashed-12B-v1.0-GGUF

Starcannon-Unleashed-12B-v1.0-GGUF 是一个融合模型，结合了不同预训练语言模型的优点，在角色回复和长上下文稳定性方面表现出色。

image/png

🚀 快速开始

本模型支持 ChatML 和 Mistral 格式，个人建议使用 ChatML 进行测试，你可以根据喜好选择合适的格式。同时，推荐使用以下设置：Starcannon-Unleashed-12B-v1.0-ST-Formatting-2024-10-29.json。

重要提示

打开 Silly Tavern 并使用“Master Import”（可在“A”标签 - 高级格式中找到），将“INSERT WORLD HERE”占位符替换为角色所属的世界/宇宙。若不适用，可直接删除该部分。
检查用户设置，将“Example Messages Behavior”设置为“Never include examples”，以防止对话示例在上下文中发送两次。若未设置，可能会输出 <|im_end|> 标记。更多信息请参考此帖子。

温度设置

温度设置在 1.15 - 1.25 效果较好，但较低的温度也可能适用，只要同时调整 Min P 和 XTC 以确保模型不会卡顿。你可以根据喜好进行调整。

✨ 主要特性

融合优势：融合了 Starcannon v3 和 NemoMix Unleashed 两个模型的优点，既具备 Starcannon v3 角色回复的出色表现，又拥有 NemoMix Unleashed 在长上下文下的稳定性。
格式支持：支持 ChatML 和 Mistral 两种格式，可根据个人喜好选择。

📦 量化版本

GGUF 版本

特别感谢 mradermacher 和 bartowski 提供的 GGUF 量化版本！

EXL2 版本

感谢 Statuo 提供的 EXL2 量化版本！

💻 使用示例

输出示例

image/jpeg

使用建议

输出长度控制：对话示例和第一条消息非常重要，模型会模仿这些部分的风格。如果你想要短输出，可使对话示例和第一条消息简短；若想要长输出，确保示例包含完整段落和多个句子。
调整温度：如果对话示例和第一条消息简短，但模型仍输出冗长内容，可逐步降低温度，先保持 Min P 和 XTC 不变，测试结果后再根据喜好调整。若仍有问题，可提高 XTC 阈值。
利用作者笔记：若希望指令对下一次回复产生更大影响，可在聊天中使用深度为 2 的作者笔记作为系统消息。例如，测试模型时使用的笔记：“Scenario: Spontaneous. {{char}} has full autonomy to do anything they wish and progress the interaction in any way they like.”

📚 详细文档

免责声明

这是作者首次尝试合并模型，且并非编码专家。在合并过程中，大部分时间可能并不理解具体操作，但在执行合并代码后，对模型进行了严格测试，结果令人满意。

合并目标

作者希望创建一个能融合各个微调/合并模型优点的模型，使一个模型能够弥补另一个模型的弱点。

模型选择原因

Starcannon v3：作者非常喜欢该模型角色回复的表现，感觉模型就像角色本身，而非扮演角色。但该模型在达到 16K 上下文时会出现连贯性问题。
NemoMix Unleashed：该模型在长上下文中具有出色的稳定性，即使超过设置的上下文大小，仍能保持连贯和稳定，且具备理解言外之意的能力。

未来计划

作者希望学习微调模型，但由于个人电脑性能有限，可能会在有更多时间和资源时再进行尝试。

🔧 技术细节

合并方法

本模型使用 mergekit 工具，采用 della_linear 合并方法，以 G:\text-generation-webui\models\MarinaraSpaghetti_NemoMix-Unleashed-12B 为基础进行合并。

合并模型

G:\text-generation-webui\models\Nothingiisreal_MN-12B-Starcannon-v3

配置文件

base_model: G:\text-generation-webui\models\MarinaraSpaghetti_NemoMix-Unleashed-12B
dtype: bfloat16
merge_method: della_linear
parameters:
  epsilon: 0.05
  int8_mask: 1.0
  lambda: 1.0
slices:
- sources:
  - layer_range: [0, 40]
    model: G:\text-generation-webui\models\MarinaraSpaghetti_NemoMix-Unleashed-12B
    parameters:
      density: 0.65
      weight: 0.4
  - layer_range: [0, 40]
    model: G:\text-generation-webui\models\Nothingiisreal_MN-12B-Starcannon-v3
    parameters:
      density: 0.55
      weight: 0.6