W

Wav2vec Test

由 othrif 开发
基于facebook/wav2vec2-large-xlsr-53微调的埃及阿拉伯语自动语音识别模型,使用arabicspeech.org MGB-3数据集训练。
下载量 27
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对埃及阿拉伯语优化的自动语音识别(ASR)模型,能够将阿拉伯语语音转换为文本。

模型特点

埃及阿拉伯语优化
专门针对埃及阿拉伯语方言进行微调,提高识别准确率
基于XLSR模型
基于facebook的wav2vec2-large-xlsr-53模型微调,具备强大的语音特征提取能力
16kHz采样率支持
支持16kHz采样率的语音输入,适合常见语音应用场景

模型能力

阿拉伯语语音识别
埃及方言识别
语音转文本

使用案例

语音转录
埃及阿拉伯语语音转写
将埃及阿拉伯语语音内容转换为文本
在MGB-3测试集上WER为55.2
语音助手
埃及方言语音交互
为埃及地区用户提供方言语音交互能力