M

Mpt 7b Storywriter

由 mosaicml 开发
专为超长文本阅读与创作设计的虚构故事生成模型,支持65k+ tokens上下文长度
下载量 769
发布时间 : 5/4/2023
模型介绍
内容详情
替代品

模型简介

基于MPT-7B微调的长文本生成模型,专注于小说创作和长文本理解,采用ALiBi技术突破上下文长度限制

模型特点

超长上下文处理
支持65k tokens上下文窗口,推理时可扩展至84k+ tokens
ALiBi位置编码
采用线性偏置注意力技术实现动态上下文扩展
高效训练优化
集成FlashAttention、QK层归一化等技术提升训练效率
商业友好许可
Apache 2.0许可证允许商业用途

模型能力

长文本生成
小说创作
故事续写
超长文本理解

使用案例

创意写作
小说自动生成
根据开头段落生成完整小说内容
展示过生成84k tokens连贯文本的能力
故事续写
基于经典文学作品(如《了不起的盖茨比》)生成后续情节
模型能保持原作文风并生成合理结局
长文本分析
超长文档处理
对整本小说进行内容分析和摘要生成