W

Wav2vec2 2 Bert Large No Adapter Frozen Enc

由 speech-seq2seq 开发
该模型是基于librispeech_asr数据集训练的语音识别模型,在评估集上取得了2.0133的词错误率(WER)。
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个自动语音识别(ASR)模型,能够将语音转换为文本。模型基于librispeech_asr数据集训练,适用于英语语音识别任务。

模型特点

低词错误率
在评估集上取得了2.0133的词错误率(WER),表现良好
基于LibriSpeech训练
使用标准的librispeech_asr数据集进行训练,具有可靠的训练基础
优化的训练配置
采用了梯度累积、学习率预热和混合精度训练等优化技术

模型能力

英语语音识别
语音转文本

使用案例

语音转录
音频转录
将英语语音内容转换为文本
词错误率2.0133
辅助工具
字幕生成
为英语视频内容自动生成字幕
null