C

Chinese Hubert Base

由 TencentGameMate 开发
基于1万小时WenetSpeech L子集预训练的中文语音模型,适用于语音相关任务
下载量 1,312
发布时间 : 6/2/2022

模型简介

该模型是针对中文语音数据的预训练模型,采用Wav2Vec2/HuBERT架构,可用于语音特征提取等任务。需要配合分词器和标注数据进行微调才能用于语音识别。

模型特点

大规模中文预训练
基于1万小时的中文语音数据(WenetSpeech L子集)进行预训练
轻量级部署
支持半精度推理(half precision),降低计算资源需求
灵活适配
可作为基础模型适配多种下游语音任务

模型能力

语音特征提取
语音表示学习

使用案例

语音处理
语音识别基础模型
通过微调可用于构建中文语音识别系统
需配合分词器和标注数据微调
语音特征提取
提取语音的高级特征表示
可用于后续语音分析任务
AIbase
智启未来,您的人工智能解决方案智库
简体中文