A

Asr Whisper Medium Commonvoice Ar

由 speechbrain 开发
基于CommonVoice阿拉伯语数据集微调的Whisper medium语音识别模型,由SpeechBrain团队开发
下载量 17
发布时间 : 7/20/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Whisper medium架构的自动语音识别系统,专门针对阿拉伯语进行了优化,在CommonVoice阿拉伯语数据集上微调

模型特点

高精度阿拉伯语识别
在CommonVoice阿拉伯语测试集上达到14.82%的WER
基于Whisper架构
利用OpenAI Whisper medium预训练模型进行微调
端到端训练
完整的编码器-解码器架构,直接输出文本结果
自动音频处理
内置音频归一化功能(重采样+单声道选择)

模型能力

阿拉伯语语音识别
音频转录
16kHz单声道音频处理

使用案例

语音转录
阿拉伯语语音转文字
将阿拉伯语语音内容转换为文本
测试集WER 14.82%,CER 4.95%
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手的前端语音识别模块