M

Mpt 30b Chat

由 mosaicml 开发
MPT-30B-Chat 是由 MosaicML 开发的对话生成模型,基于 MPT-30B 在多个高质量对话数据集上微调而成,支持多轮对话和长上下文处理。
下载量 1,502
发布时间 : 6/9/2023
模型介绍
内容详情
替代品

模型简介

这是一个专为对话场景优化的开源大语言模型,擅长多轮对话和指令跟随,具备8k token上下文窗口和高效推理能力。

模型特点

长上下文支持
通过ALiBi技术支持8k token上下文窗口,并可扩展至16k
高效推理
采用FlashAttention和Triton优化实现高效推理
多轮对话优化
在多个高质量对话数据集上微调,擅长多轮对话场景
开源可商用
基于商用许可的开源模型,性能超越GPT-3

模型能力

多轮对话生成
指令跟随
文本摘要
内容创作
代码生成

使用案例

对话系统
智能客服
用于构建多轮对话的客户服务机器人
能理解复杂问题并保持对话连贯性
虚拟助手
开发具备长期记忆能力的个人助手
支持8k token上下文窗口,能记住更多对话历史
内容生成
社交媒体内容创作
根据文章摘要生成推文等社交媒体内容
如示例所示能生成专业、吸引人的推文
食谱生成
根据简单提示生成详细食谱
能生成完整的纯素香蕉面包食谱等