W

Wav2vec2 Large Xlsr 53 Demo Colab

由 project2you 开发
基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的语音识别模型
下载量 21
发布时间 : 3/2/2022

模型简介

这是一个针对语音识别任务进行优化的模型,基于wav2vec2架构,在common_voice数据集上进行了微调训练。

模型特点

高效微调
基于预训练的wav2vec2-large-xlsr-53模型进行微调,提高了在目标数据集上的性能
低词错误率
在评估集上取得了1.6299的词错误率(WER),表现优异
混合精度训练
使用原生AMP进行混合精度训练,提高了训练效率

模型能力

语音识别
自动语音转文本

使用案例

语音转录
语音转文字
将语音内容转换为文字记录
词错误率低至1.6299
AIbase
智启未来,您的人工智能解决方案智库
简体中文