M

Musicgen Melody

由 facebook 开发
MusicGen是一个简单可控的音乐生成模型,能够根据文本描述或旋律输入生成高质量音乐。
下载量 3,632
发布时间 : 6/8/2023
模型介绍
内容详情
替代品

模型简介

MusicGen是一个单阶段自回归Transformer模型,基于32kHz EnCodec标记器训练,使用4个以50Hz采样的码本。与现有方法不同,它不需要自监督的语义表示,并能一次性生成所有码本。

模型特点

并行预测
通过在码本之间引入微小延迟,实现并行预测,每秒音频仅需50个自回归步骤。
旋律引导生成
可以根据给定的音频旋律和文本描述生成音乐,保持原始旋律特征。
简单可控
不需要自监督的语义表示,模型结构简单且易于控制。

模型能力

文本到音乐生成
旋律引导音乐生成
多种音乐风格生成

使用案例

音乐创作
背景音乐生成
为视频、游戏等内容生成定制背景音乐。
可生成8秒至更长的音乐片段
旋律扩展
基于现有旋律片段生成完整音乐作品。
保持原始旋律特征的同时扩展音乐内容
研究
音乐生成AI研究
用于探索生成模型在音乐领域的应用。