M

Musicgen Stereo Melody

由 facebook 开发
MusicGen是一款由Meta AI开发的文本生成音乐模型,能够根据文本描述或音频提示生成高质量立体声音乐样本。
下载量 82
发布时间 : 10/23/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer的自回归音乐生成模型,支持通过文本描述或旋律提示生成32kHz立体声音乐,无需自监督语义表示即可一次性生成全部音频码本。

模型特点

立体声生成
通过两路令牌流交错处理实现立体声输出,相比单声道版本有更佳的空间感
旋律控制
支持输入参考旋律,生成的音乐将保持原有旋律轮廓
高效生成
采用延迟码本预测技术,每秒音频仅需50个自回归步骤
多码本并行
同时预测4个EnCodec码本,无需分阶段生成

模型能力

文本到音乐生成
旋律引导音乐生成
立体声音频合成
音乐风格转换

使用案例

创意辅助
背景音乐生成
根据场景描述自动生成匹配的背景音乐
可生成8-30秒不同风格的音乐片段
旋律扩展
基于用户提供的简单旋律发展完整编曲
保持原始旋律特征的同时添加和声与节奏
研究应用
生成模型研究
探索音频生成模型的架构与控制方法
提供可比较的基线模型