language:
- en
pipeline_tag: text-generation
tags:
- unsloth
- axolotl
license: cc-by-nc-nd-4.0
Llama 3 梦境生成巨著版
🚨 警告 🚨
该模型存在问题,请改用以下预览模型:
若模型持续生成无意义输出,请阅读此讨论帖。
资源导航

提示工程
模型采用扩展版ChatML格式
<|im_start|>system
(此处填入标准格式的故事设定)
(通常包含情节梗概、风格描述与角色设定)<|im_end|>
<|im_start|>user
(您对故事后续发展的指令)<|im_end|>
<|im_start|>text names=爱丽丝
(从爱丽丝视角展开的叙事)<|im_end|>
<|im_start|>text
(无特定视角的纯旁白叙事)<|im_end|>
<|im_start|>user
(您对故事后续发展的指令)<|im_end|>
<|im_start|>text names=鲍勃
(从鲍勃视角展开的叙事)<|im_end|>
Opus V1扩展主要新增了text
角色,并调整了角色命名规则。
需特别注意:
text
消息可附加names
属性(非必须),用于角色扮演时标记"活跃"角色
- 允许连续多个
text
角色消息(尤其涉及多角色时)
- 单条消息可关联多个角色名
- 命名格式为
names= {{名称[0]}}; {{名称[1]}}
,注意names=
后和分号后的空格,这种间距能使名称获得最自然的token化效果
虽然模型核心能力在于卓越的故事创作与角色扮演,但也擅长多种写作任务及通用辅助。
以下是不同任务的提示方法:
可控故事创作与角色扮演
- 故事创作提示指南
- 角色扮演提示指南
- 输入:
- 系统提示:提供包含以下要素的故事/角色设定:
- 对话轮次:
- 文本/消息轮:代表故事或角色扮演片段
- 指令轮:指导模型后续发展
- 输出:故事/角色扮演的延续
故事梗概提炼
- 提示指南
- 输入:完整故事或若干章节
- 输出:故事或章节的概要
示例:
用50字概括短篇小说
强大法师玛尔吉斯用死灵术召唤逝去的恋人尼莉莎,却发现她已非昔日模样,由此质疑爱情本质、记忆真相与魔法力量。
用200字概括短篇小说
故事设定在苏斯兰城的黑暗奇幻世界中,年迈的强大法师玛尔吉斯居于锥形山巅的塔楼。这位精通各类巫术与死灵术的大师深陷倦怠与忧郁,渴望通过召唤年少恋人尼莉莎的灵魂获得慰藉。当幽灵显现后,玛尔吉斯逐渐察觉其相貌举止与记忆存在微妙差异,开始质疑这是真实的尼莉莎还是魔法幻象。在认知动摇中,他意识到即便强大如死灵术也无法重现往昔或带来真正快乐,最终遣散幽灵,回归孤独塔楼接受衰老法师的宿命。
用150字概括CNN新闻
文章探讨近期阿拉斯加痘与鼠疫等动物传播疾病致人死亡案例。前巴尔的摩卫生专员温丽娜博士解析宠物传播疾病的三大途径:粪口传播、抓咬伤、蜱虫/跳蚤/蚊子媒介传播。强调宠物接种疫苗、保持清洁及采取常识性预防措施的重要性,特别提醒免疫力低下者、婴幼儿与孕妇需加强防护。
用50字概括CNN新闻
专家解析猫狗等宠物传播疾病的风险,强调疫苗接种、卫生管理与定期兽医护理的预防价值。
角色设定生成
- 提示指南
- 输入:故事文本或角色集合
- 输出:角色特征描述
示例:
用50字描述故事中的玛尔吉斯
玛尔吉斯是位白须绿眸、身披紫袍的远古法师,精通禁忌死灵术。虽法力无边,却深陷忧郁与虚无的泥沼。
用50字描述故事中的王子
这位痴情王子从优雅少年渐变为严肃艺术家,对逝去王后的思念驱动他创造"爱之珠"。其色彩感知与设计理念随岁月演变,折射出日渐成熟的审美视野。
文风分析
分析该故事文风
作品采用极具画面感的描写手法,着力营造时空氛围。通过明喻/暗喻/典故等修辞与长短句交替的韵律节奏,构建出层次丰富的叙事质感。
分析该故事文风
行文充满仪式感的细腻描写,聚焦"爱之珠"的华美意象。感官细节堆砌出沉浸式场景,庄重冥想的笔调呼应着王子对亡妻的永恒追忆。
大纲转章节
- 提示指南
- 输入:简要情节梗概与期望章节数
- 输出:各章节内容设计
其他功能...
采样参数
对于故事创作与角色扮演,推荐采用"Min P"采样策略:
min_p
范围:[0.01, 0.1]
temperature
范围:[0.5, 1.5]
建议初始值:min_p=0.1; temperature=0.8
在较低温度下,适当设置presence/frequency/repetition惩罚参数效果更佳。
训练数据
微调数据集包含约1亿token,涵盖:
- 可控故事创作
- 角色扮演
- 写作辅助
- 通用助手
每条样本最长可达31000token
所有故事创作与角色扮演样本均基于人类撰写文本

模型运行
模型理论上兼容所有支持基础模型的框架,但需注意提示格式与token化问题。
推荐使用以下版本:
DreamGen.com在线运行(免费)
可通过dreamgen.com免费使用:
本地部署
- 确保提示格式严格符合Opus V1标准
- 无论使用何种后端,规范的提示格式与正确的token化至关重要
- 阅读提示指南
- 查看格式化代码
- 验证
<|im_start|>
和<|im_end|>
的token化是否正确
- vLLM
- SillyTavern
- 官方集成文档适用于API与本地模型
- SillyTavern测试版内置DreamGen角色扮演预设
- 其他预设文件见此(v2版由@MarinaraSpaghetti提供)
- 务必取消勾选
跳过特殊token
选项
- 注意这只是近似模拟Opus V1提示,效果非完美
- 适配预设的重写角色卡:
- LM Studio
- 配置
- 类似ChatML格式,仅将"assistant"角色改为"text"
- 存在bug:删除消息或点击"继续"时异常,详情见此
- HuggingFace
- 对话模板
- 类似ChatML格式,仅将"assistant"角色改为"text"
已知问题
- 34B版本重复问题:
- 34B有时会陷入单词或近义词重复循环,这在各类Yi 34B微调模型中较常见
- GGUF量化版:
- 可能存在token化异常。用户反馈
<|im_start|>
和<|im_end|>
被拆分为多token。llama.cpp的token化也可能不准确(Yi tokenizer与Llama 2存在细微差异)
许可协议