M

Musicgen Small

由 facebook 开发
MusicGen是一款基于文本描述或音频提示生成高质量音乐样本的文本到音乐模型。
下载量 123.91k
发布时间 : 6/8/2023
模型介绍
内容详情
替代品

模型简介

单阶段自回归Transformer模型,采用32kHz EnCodec分词器训练,配备4个50Hz采样的码本,无需自监督语义表征即可生成音乐。

模型特点

单阶段生成
无需自监督语义表征,可一次性生成全部4个码本
并行预测
通过码本间微小延迟实现并行预测,每秒钟音频仅需50个自回归步骤
多码本处理
采用32kHz EnCodec分词器,配备4个50Hz采样的码本

模型能力

根据文本描述生成音乐
支持多种音乐风格生成
可控制生成音乐时长

使用案例

音乐创作
背景音乐生成
为播客、视频等内容生成定制背景音乐
音乐灵感探索
通过不同提示词探索音乐创作可能性
研究应用
生成模型研究
探索音乐生成模型的局限性和可能性