W

Wav2vec2 Large Xls Ar

由 mohamed1ai 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型,在Common Voice阿拉伯语数据集上测试WER为52%。
下载量 30
发布时间 : 3/2/2022

模型简介

这是一个用于阿拉伯语自动语音识别(ASR)的模型,基于Facebook的wav2vec2-large-xlsr-53架构微调而成,支持将阿拉伯语语音转换为文本。

模型特点

高精度阿拉伯语识别
针对阿拉伯语优化的语音识别模型,在Common Voice测试集上WER为52%
无需语言模型
可直接使用,不需要额外的语言模型支持
16kHz采样率支持
专门优化用于处理16kHz采样率的语音输入

模型能力

阿拉伯语语音识别
语音转文本
实时语音处理

使用案例

语音转写
阿拉伯语语音转录
将阿拉伯语语音内容转换为文本格式
在Common Voice测试集上达到52% WER
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手和语音控制应用
AIbase
智启未来,您的人工智能解决方案智库
简体中文