M

MN Slush

由 crestf411 开发
Slush是一个采用高LoRA丢弃率训练的双阶段模型,专注于提升创造力和角色扮演能力
下载量 59
发布时间 : 11/20/2024
模型介绍
内容详情
替代品

模型简介

Slush是一个经过特殊训练的大语言模型,采用双阶段训练方法。第一阶段延续基础模型的预训练以提升创造力和写作能力,第二阶段进行微调以增强角色扮演能力。模型适用于非全年龄段用户,特别适合角色扮演场景。

模型特点

双阶段训练
采用预训练延续和微调两个阶段,分别提升创造力和角色扮演能力
高LoRA丢弃率
训练中采用0.5的LoRA丢弃率,基于最新研究成果优化模型性能
长上下文支持
支持16384 tokens的长上下文处理能力
LoRA+技术
采用LoRA+训练方法,学习率比率为15,优化训练效果

模型能力

创意写作
角色扮演对话
长文本生成
指令跟随

使用案例

娱乐
角色扮演游戏
作为游戏中的角色与用户进行沉浸式互动
提供高质量的角色扮演体验
创意写作辅助
帮助用户生成创意故事或小说内容
产生富有创意的文本输出
对话系统
个性化聊天机器人
构建具有特定性格特征的聊天机器人
提供个性化和一致性的对话体验