wav2vec2语音识别模型 - 开源免费，基于数据集训练实现低词错误率识别

Wav2vec2 2 Bert Large No Adapter Frozen Enc

由 speech-seq2seq 开发

该模型是基于librispeech_asr数据集训练的语音识别模型，在评估集上取得了2.0133的词错误率(WER)。

下载量 25

发布时间 : 3/2/2022

模型简介

这是一个自动语音识别(ASR)模型，能够将语音转换为文本。模型基于librispeech_asr数据集训练，适用于英语语音识别任务。

低词错误率

在评估集上取得了2.0133的词错误率(WER)，表现良好

基于LibriSpeech训练

使用标准的librispeech_asr数据集进行训练，具有可靠的训练基础

优化的训练配置

采用了梯度累积、学习率预热和混合精度训练等优化技术

英语语音识别

语音转文本

语音转录

音频转录

将英语语音内容转换为文本

词错误率2.0133

辅助工具

字幕生成

为英语视频内容自动生成字幕

null