M

Musicgen Stereo Melody Large

由 facebook 开发
MusicGen是一款支持立体声和旋律引导的文本到音乐生成模型,能够根据文本描述或音频提示生成高质量音乐样本。
下载量 61
发布时间 : 10/23/2023
模型介绍
内容详情
替代品

模型简介

MusicGen是一个基于Transformer架构的自回归音乐生成模型,支持通过文本描述或旋律引导生成32kHz立体声音频。该模型采用EnCodec音频分词器,能一次性生成所有码本,实现高效音乐合成。

模型特点

立体声支持
通过20万次迭代微调实现的立体声生成能力,采用延迟模式处理两路令牌流
旋律引导
支持根据输入旋律生成风格匹配的音乐,保持原始旋律特征
高效生成
采用并行预测机制,每秒音频仅需50个自回归步骤,显著提升生成速度
多码本联合预测
一次性生成所有4个码本,无需分阶段处理

模型能力

文本到音乐生成
旋律引导音乐生成
立体声音频合成
多种音乐风格生成

使用案例

创意内容生成
背景音乐创作
为视频、游戏等内容生成定制背景音乐
可根据文本描述快速生成匹配场景情绪的音乐
旋律扩展
基于现有旋律片段生成完整编曲
保持原始旋律特征的同时丰富音乐表现
音乐研究
音乐生成算法研究
用于探索AI音乐生成的前沿技术