E

Encodec 24khz

由 facebook 开发
EnCodec是由Meta AI开发的高保真实时神经音频编解码器,采用端到端训练方式,支持多种带宽设置。
下载量 534.08k
发布时间 : 6/12/2023
模型介绍
内容详情
替代品

模型简介

EnCodec是一种利用神经网络的高保真音频编解码器,通过量化潜在空间和流式编码器-解码器架构实现实时音频压缩与解压缩。

模型特点

高保真音频压缩
通过神经网络实现高质量的音频压缩,保持原始音频的感知质量
实时处理能力
支持流式和非流式两种处理模式,满足不同实时性需求
多带宽支持
可在1.5kbps到12kbps等多种带宽设置下工作,适应不同应用场景
端到端训练
采用端到端训练方式,简化模型架构并提高性能

模型能力

音频压缩
音频解压缩
实时音频处理
多带宽音频编码

使用案例

语音处理
语音通信压缩
用于实时语音通信中的音频压缩传输
在3kbps下性能优于Opus在12kbps的表现
音乐流媒体
高质量音乐流传输
用于音乐流媒体服务中的高效音频压缩
通过Transformer模型可实现40%带宽减少
音频存储
高效音频存储
用于音频文件的压缩存储
保持高保真同时显著减少存储空间