W

Wav2vec2 Large Xlsr 53 Arabic

由 jonatasgrosman 开发
基于facebook/wav2vec2-large-xlsr-53微调的阿拉伯语语音识别模型,在Common Voice和阿拉伯语语音语料库上训练
下载量 2.3M
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

针对阿拉伯语优化的自动语音识别(ASR)模型,支持16kHz采样率的语音输入转换为文本

模型特点

高性能阿拉伯语识别
在Common Voice阿拉伯语测试集上达到39.59% WER和18.18% CER,优于同类阿拉伯语ASR模型
多数据集训练
结合Common Voice 6.1和阿拉伯语语音语料库进行训练,提高模型泛化能力
即用型模型
无需额外语言模型即可直接使用,简化部署流程

模型能力

阿拉伯语语音识别
16kHz音频处理
长语音转录

使用案例

语音转文字
语音备忘录转录
将阿拉伯语语音备忘录转换为可搜索的文本
准确率约80%(基于CER推断)
客服对话记录
自动记录阿拉伯语客服通话内容
辅助技术
听力障碍辅助
为听力障碍者提供实时字幕