M

Musicgen Stereo Medium

由 facebook 开发
Meta AI发布的立体声音乐生成模型,支持通过文本描述生成高质量音乐
下载量 303
发布时间 : 10/23/2023
模型介绍
内容详情
替代品

模型简介

基于文本描述或音频提示生成立体声音乐样本的文本转音乐模型,采用自回归Transformer架构

模型特点

立体声生成
通过双声道令牌流和延迟交错处理实现立体声音效
单阶段生成
无需自监督语义表征,可一次性生成全部4个码本
并行预测
通过码本间微小延迟设计实现每秒50个自回归步骤的并行预测
旋律引导
支持基于现有旋律进行音乐生成(需使用特定变体)

模型能力

文本描述生成音乐
音频提示引导生成
立体声音频生成
多风格音乐生成

使用案例

音乐创作
背景音乐生成
为视频/播客生成定制背景音乐
可生成符合场景情绪的音乐片段
音乐灵感探索
通过不同风格组合发现新音乐创意
生成融合多种风格元素的实验性音乐
音频制作
音效设计
生成特定场景的音效或过渡音乐
可生成符合要求的短音频片段