wav2vec2-final-1-lm-2开源语音识别模型 - 低错误率精准识别语音内容

Wav2vec2 Final 1 Lm 2

由 chrisvinsen 开发

基于facebook/wav2vec2-base微调的语音识别模型，词错误率(WER)0.283，使用3元语法时词错误率0.126

下载量 15

发布时间 : 6/2/2022

模型简介

这是一个用于语音识别的微调模型，基于wav2vec2架构，在特定数据集上训练得到

低词错误率

在评估集上词错误率为0.4499，使用3元语法时降至0.126

基于wav2vec2架构

采用facebook的wav2vec2-base作为基础模型进行微调

优化训练

经过60轮训练，采用线性学习率调度和预热策略

语音识别

音频转文本

语音转录

会议记录转录

将会议录音转换为文字记录

词错误率0.283

语音指令识别

识别和理解语音指令