W

Wav2vec2 Xls R 300m Hebrew

由 imvladikon 开发
这是一个基于facebook/wav2vec2-xls-r-300m模型微调的希伯来语自动语音识别模型,通过两阶段训练在小规模和大规模数据集上优化性能。
下载量 1.2M
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于希伯来语的自动语音识别任务,通过两阶段微调过程在小规模高质量数据集和大规模多样化数据集上进行训练,以提高识别准确率。

模型特点

两阶段微调训练
先在小规模高质量数据集上微调,再在大规模多样化数据集上进行二次训练,提高模型鲁棒性
多源数据训练
训练数据包含高质量标注数据、多样化来源数据以及模型弱标记的未标记数据
低词错误率
在小规模测试集上达到17.73%的词错误率,在大规模测试集上达到23.18%的词错误率

模型能力

希伯来语语音识别
音频转文本
鲁棒语音处理

使用案例

语音转录
希伯来语会议记录
将希伯来语会议录音自动转录为文本
词错误率约23.18%
希伯来语语音助手
为希伯来语语音助手提供语音识别能力
语音分析
希伯来语语音内容分析
分析希伯来语语音内容并提取关键信息