A

Audio Magnet Medium

由 facebook 开发
MAGNeT是一款基于非自回归Transformer的文本生成音乐与音效模型,能够根据文本描述生成高质量音频样本。
下载量 435
发布时间 : 1/10/2024
模型介绍
内容详情
替代品

模型简介

MAGNeT采用掩码生成式非自回归Transformer架构,基于32kHz EnCodec分词器训练,使用4个50Hz采样的码本。该模型无需语义标记条件输入或级联模型,仅通过单一非自回归Transformer即可生成全部4个码本。

模型特点

单一非自回归Transformer架构
无需级联模型或语义标记条件输入,仅通过单一Transformer生成全部码本。
高质量音频生成
能够根据文本描述生成高质量的音乐和音效样本。
多码本支持
基于32kHz EnCodec分词器训练,使用4个50Hz采样的码本。

模型能力

文本生成音乐
文本生成音效
高质量音频样本生成

使用案例

人工智能音乐生成研究
音乐创作辅助
根据文本描述生成欢快的摇滚或充满能量的电子舞曲。
生成高质量的音乐样本
机器学习爱好者探索
生成模型能力探索
探索非自回归Transformer在音频生成中的应用。
理解模型在音频生成中的表现