M

Mpt 7b Chat

由 mosaicml 开发
MPT-7B-Chat是一款专为对话生成设计的类聊天机器人模型,基于MPT-7B基础模型在多个对话数据集上微调而成。
下载量 85.84k
发布时间 : 5/4/2023
模型介绍
内容详情
替代品

模型简介

该模型专注于对话生成任务,采用改进的解码器专用Transformer架构,支持长上下文对话生成。

模型特点

长上下文支持
通过ALiBi技术支持扩展到4096 tokens的上下文长度
高效训练架构
采用FlashAttention、QK LayerNorm等技术优化训练效率
多数据集微调
在ShareGPT-Vicuna、HC3等多个高质量对话数据集上微调

模型能力

对话生成
指令跟随
文本摘要
内容创作

使用案例

智能助手
客服对话系统
构建自动客服对话系统
可生成自然流畅的客服回复
内容创作
社交媒体内容生成
根据新闻摘要生成社交媒体推文
如示例中生成的宣传推文