W

Wav2vec2 Xls R 300m Zh HK Lm V2

由 w11wo 开发
基于XLS-R架构的自动语音识别模型,针对粤语(zh-HK)优化,在Common Voice数据集上微调并加入5-gram语言模型。
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对粤语(zh-HK)优化的自动语音识别(ASR)模型,基于Facebook的Wav2Vec2-XLS-R-300M架构微调,并整合了PyCantonese语料库训练的5-gram语言模型以提高识别准确率。

模型特点

粤语优化
专门针对粤语(zh-HK)优化的语音识别模型,在Common Voice粤语数据集上微调。
5-gram语言模型增强
整合了基于PyCantonese语料库训练的5-gram语言模型,显著提升识别准确率。
鲁棒性能
参与了HuggingFace组织的鲁棒语音挑战赛事,在不同数据集上表现稳定。

模型能力

粤语语音识别
自动语音转文本
支持多种语音数据集

使用案例

语音转写
粤语语音转文字
将粤语语音内容转换为文字记录
在Common Voice数据集上CER为24.09%
语音应用开发
粤语语音助手
开发支持粤语的语音交互应用