W

Wav2vec2 Xls R 300m Zh HK V2

由 w11wo 开发
基于XLS-R架构的粤语自动语音识别模型,在Common Voice粤语数据集上微调
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对粤语(zh-HK)优化的自动语音识别模型,基于Facebook的Wav2Vec2-XLS-R-300M架构微调而成,适用于粤语语音转文本任务。

模型特点

粤语优化
专门针对粤语语音识别进行优化训练
大规模预训练
基于300M参数的XLS-R架构,具有强大的语音特征提取能力
多数据集验证
在Common Voice和鲁棒语音赛事等多个数据集上进行评估

模型能力

粤语语音识别
语音转文本
自动语音识别

使用案例

语音转写
粤语语音转录
将粤语语音内容转换为文字
在Common Voice 8测试集上CER为23.02%
语音助手
粤语语音指令识别
用于粤语语音助手或智能家居设备的语音指令识别