M

Musicgen Melody Large

由 facebook 开发
MusicGen是一款由Meta AI开发的文本生成音乐模型,能够根据文本描述或音频提示生成高质量音乐样本。
下载量 1,414
发布时间 : 10/23/2023
模型介绍
内容详情
替代品

模型简介

MusicGen采用单阶段自回归Transformer架构,基于32kHz EnCodec分词器训练,支持通过文本或文本+旋律生成音乐。

模型特点

旋律引导生成
支持通过文本描述结合旋律提示生成音乐,增强创作控制力
高效并行预测
通过码本延迟技术实现每秒音频仅需50个自回归步骤
多码本处理
同时处理4个以50Hz采样的码本,一次性生成完整音频

模型能力

文本到音乐生成
旋律引导音乐生成
高质量音频合成

使用案例

音乐创作
背景音乐生成
为视频内容自动生成匹配的背景音乐
可生成8-30秒的高质量音乐片段
旋律改编
基于现有旋律生成不同风格的音乐变体
保持原旋律特征的同时改变音乐风格
AI研究
生成模型研究
探索音频生成模型的技术边界
提供可比较的基准模型