wav2vec2-base-checkpoint-10开源语音识别模型 - 基于数据集微调、低错误率

Wav2vec2 Base Checkpoint 10

由 jiobiala24 开发

基于wav2vec2-base-checkpoint-9在common_voice数据集上微调的语音识别模型，在评估集上词错误率为0.3292

下载量 16

发布时间 : 3/2/2022

模型简介

这是一个语音识别模型，基于wav2vec2架构，在common_voice数据集上进行了微调，能够将语音转换为文本。

低词错误率

在评估集上取得了0.3292的词错误率，表现良好

基于wav2vec2架构

采用wav2vec2-base架构，具有良好的语音特征提取能力

微调优化

在common_voice数据集上进行了30轮微调训练

语音转文本

自动语音识别

语音转录

语音转写

将语音内容转换为文字记录

词错误率0.3292

语音助手

语音指令识别

识别用户的语音指令