S

Speechgpt 7B Ma

由 fnlp 开发
SpeechGPT是一个具备内在跨模态对话能力的大型语言模型,能够根据人类指令感知和生成多模态内容。
下载量 37
发布时间 : 9/14/2023
模型介绍
内容详情
替代品

模型简介

SpeechGPT通过离散语音表征构建了跨模态语音指令数据集,采用三阶段训练策略,具备出色的多模态人类指令跟随能力。

模型特点

跨模态对话能力
能够同时处理语音和文本输入输出,实现真正的跨模态交互
三阶段训练策略
采用模态适应预训练、跨模态指令微调和模态链式指令微调的三阶段训练方法
大规模语音指令数据集
构建了SpeechInstruct数据集,包含约900万对单元-文本数据

模型能力

语音识别
语音合成
跨模态对话
文本生成
指令跟随

使用案例

个人助理
语音问答
通过语音提问获取信息回答
可准确理解问题并生成语音或文本回答
教育
语言学习
帮助学习者练习英语听说能力
可提供语音交互式学习体验