E

Encodec 48khz

由 facebook 开发
EnCodec是由Meta AI开发的实时高保真神经音频编解码器,支持多种带宽配置和流式处理。
下载量 23.25k
发布时间 : 6/12/2023
模型介绍
内容详情
替代品

模型简介

基于神经网络的端到端音频编解码器,采用量化潜在空间和多尺度频谱对抗器,支持实时音频压缩/解压缩。

模型特点

多尺度频谱对抗训练
通过单一对抗器简化训练流程,有效减少伪影并提升生成质量
动态损失平衡
创新性解耦超参数与损失尺度,显著提高训练稳定性
流式处理支持
通过权重归一化和左填充技术实现连续音频流实时处理
带宽可配置
支持1.5kbps至12kbps多种压缩率,适应不同应用场景

模型能力

实时音频压缩
高保真音频重建
流式音频处理
多带宽配置

使用案例

音频通信
低带宽语音传输
在有限网络条件下实现高质量语音通话
3kbps版本性能优于Opus 12kbps
媒体服务
音乐流媒体
高效压缩音乐内容同时保持高音质
结合语言模型可减少25-40%带宽
生成式AI
语音合成
作为可微调组件用于TTS系统