M

Magnet Small 10secs

由 facebook 开发
MAGNeT是一个文本到音乐和文本到声音的模型,能够根据文本描述生成高质量的音频样本。
下载量 976
发布时间 : 1/10/2024
模型介绍
内容详情
替代品

模型简介

MAGNeT是一个基于32kHz EnCodec分词器的掩码生成非自回归Transformer,使用4个以50 Hz采样的码本进行训练。它不需要语义标记条件或模型级联,使用单一的非自回归Transformer生成所有4个码本。

模型特点

非自回归生成
使用单一的非自回归Transformer生成所有码本,无需级联模型
高质量音频生成
能够根据文本描述生成32kHz采样率的高质量音频样本
多样化风格支持
支持生成多种音乐风格,包括嘻哈、放克浩室、低保真等

模型能力

文本到音乐生成
文本到音效生成
短音频片段生成(10秒)

使用案例

音乐创作
背景音乐生成
为视频、播客等内容生成背景音乐
生成10秒长的音乐片段
音乐灵感探索
通过文本提示探索不同风格的音乐创作可能性
生成多样化的音乐样本
音效设计
游戏音效生成
为游戏场景生成环境音效
生成10秒长的音效片段