M

Musicgen Large

由 facebook 开发
MusicGen是一款文本到音乐的生成模型,能够根据文本描述或音频提示生成高质量的音乐样本。
下载量 5,125
发布时间 : 6/8/2023
模型介绍
内容详情
替代品

模型简介

MusicGen采用单阶段自回归Transformer架构,基于32kHz的EnCodec分词器训练,使用4个50Hz采样的码本。无需自监督语义表示,可一次性生成全部4个码本。

模型特点

高效生成
通过并行预测码本,每秒音频仅需50个自回归步骤,显著提升生成效率
高质量输出
基于32kHz的EnCodec分词器训练,生成音乐样本质量高
灵活控制
支持文本描述和音频提示两种输入方式,提供更灵活的音乐生成控制

模型能力

文本到音乐生成
音乐风格转换
旋律引导生成

使用案例

音乐创作
背景音乐生成
为视频、游戏等内容生成定制背景音乐
可生成符合特定风格和情绪的音乐
音乐灵感激发
为音乐人提供创作灵感和素材
快速生成多种风格的音乐片段
研究应用
生成模型研究
探索音乐生成模型的局限性和可能性