A

Audio Magnet Small

由 facebook 开发
MAGNeT 是一款文本到音乐和文本到声音的模型,能够根据文本描述生成高质量的音频样本。它是一个基于掩码生成非自回归Transformer的模型,使用32kHz EnCodec分词器。
下载量 161
发布时间 : 1/10/2024

模型简介

MAGNeT是一个基于非自回归Transformer的音频生成模型,能够根据文本描述生成音乐和音效。它不需要语义标记条件或模型级联,通过单个Transformer生成所有码本。

模型特点

非自回归生成
通过单个非自回归Transformer同时生成所有码本,无需级联模型
高质量音频生成
能够生成32kHz采样率的高质量音乐和音效样本
简化流程
不需要语义标记条件,简化了生成流程
多样化应用
支持音乐和音效两种生成任务,具有广泛的应用场景

模型能力

文本到音乐生成
文本到音效生成
高质量音频合成
多风格音乐创作

使用案例

音乐创作
音乐生成
根据文本描述生成各种风格的音乐片段
可生成欢快的摇滚、充满活力的电子舞曲等风格音乐
音效设计
音效生成
根据文本描述生成各种环境音效和特殊效果音
可生成自然环境音、机械音效等
研究应用
生成模型研究
用于探索音频生成模型的局限性和可能性
推动音频生成领域的科学进步
AIbase
智启未来,您的人工智能解决方案智库
简体中文