W

Wav2vec2 Large Xlsr 53 Arabic Egyptian

由 arbml 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型在阿拉伯语埃及方言上进行微调的自动语音识别(ASR)模型,使用通用语音数据集训练。
下载量 2,549
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于阿拉伯语埃及方言的语音识别任务,能够将语音输入转换为文本输出。

模型特点

方言支持
专门针对阿拉伯语埃及方言进行优化
基于XLSR-53
基于强大的wav2vec2-large-xlsr-53模型架构
无需语言模型
可直接使用,不需要额外的语言模型

模型能力

阿拉伯语埃及方言语音识别
16kHz音频处理

使用案例

语音转文字
埃及方言转录
将埃及阿拉伯语语音转换为文本