E

Encodec 32khz

由 facebook 开发
Meta AI开发的高保真实时神经音频编解码器,专为MusicGen项目训练
下载量 348.00k
发布时间 : 6/15/2023
模型介绍
内容详情
替代品

模型简介

EnCodec是一种利用神经网络的实时音频编解码器,支持高质量音频压缩与高效解码,可与MusicGen模型配合使用

模型特点

高保真音频压缩
采用端到端训练方式,生成高质量音频样本,有效减少伪影
实时处理能力
支持流式和非流式两种工作模式,满足不同场景需求
创新训练机制
通过多尺度频谱对抗器和损失平衡机制实现稳定高效训练
带宽可调
支持在编码和解码时指定不同带宽,适应多种应用场景

模型能力

音频压缩
音频解压缩
实时音频处理
高质量音频生成

使用案例

音乐生成
配合MusicGen使用
作为MusicGen模型的音频编解码组件
实现高质量音乐生成与压缩
音频处理
独立音频编解码
单独用于音频文件的压缩与解压缩
提供高保真音频压缩效果