W

Wav2vec2 Librispeech Clean 100h Demo Dist

由 patrickvonplaten 开发
基于facebook/wav2vec2-large-lv60在LIBRISPEECH_ASR-CLEAN数据集上微调的语音识别模型
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个语音识别模型,专门针对LIBRISPEECH_ASR-CLEAN数据集进行了优化,能够将语音转换为文本。

模型特点

高效微调
基于facebook/wav2vec2-large-lv60模型在LIBRISPEECH_ASR-CLEAN数据集上进行了高效微调。
低词错误率
在评估集上实现了0.0417的词错误率(WER),表现优异。
分布式训练
支持多GPU分布式训练,提高了训练效率。

模型能力

语音识别
英语语音转文本

使用案例

语音转写
会议记录
将会议录音自动转换为文字记录
准确率较高,词错误率仅为0.0417
语音助手
用于语音助手的语音识别模块