X

Xcodec2

由 HKUSTAudio 开发
XCodec2是一款支持多语言语音语义理解与高质量语音重建的语音标记器
下载量 32.36k
发布时间 : 1/7/2025

模型简介

XCodec2是一款基于LLaMA语音合成的训练与推理计算规模优化的语音标记器,具有单向量量化、每秒50个标记的特性,支持多语言语音语义理解与高质量语音重建。

模型特点

单向量量化
支持高效的语音编码与解码
高效标记生成
每秒可生成50个标记,实现快速语音处理
多语言支持
支持多语言语音语义理解与重建
高质量重建
能够实现高质量的语音重建

模型能力

语音编码
语音解码
语音语义理解
语音重建

使用案例

语音处理
语音压缩与重建
将语音信号压缩为标记并重建为高质量语音
高质量语音重建
多语言语音处理
支持多语言语音的语义理解与处理
跨语言语音应用
AIbase
智启未来,您的人工智能解决方案智库
简体中文