A

Asr Wav2vec2 Dvoice Darija

由 speechbrain 开发
这是一个针对摩洛哥阿拉伯语方言(Darija)的自动语音识别模型,基于wav2vec 2.0架构在DVoice数据集上微调训练而成。
下载量 120
发布时间 : 6/9/2022
模型介绍
内容详情
替代品

模型简介

该模型提供端到端的Darija语音转录功能,采用预训练的wav2vec 2.0模型作为基础,叠加DNN层并在Darija数据集上微调,最终通过CTC贪婪解码器输出文本结果。

模型特点

低资源语言支持
专门针对资源稀缺的Darija方言优化,通过迁移学习技术解决数据不足问题
社区驱动数据
基于DVoice平台收集的真实社区录音数据训练,反映实际语言使用场景
高效微调架构
在预训练的wav2vec2-large-xlsr-53模型基础上,仅添加两层DNN进行微调,实现高效训练

模型能力

摩洛哥阿拉伯语方言语音识别
16kHz单声道音频处理
自动音频标准化(重采样/单声道选择)

使用案例

语音转录
方言媒体内容转录
将摩洛哥方言的播客、视频等内容自动转为文字
测试集WER 18.28%,CER 5.85%
语音助手
方言语音指令识别
为摩洛哥地区用户提供方言交互的语音助手