W

Wav2vec2 Base Demo Colab

由 brever 开发
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上取得了31.42%的词错误率
下载量 16
发布时间 : 5/22/2022
模型介绍
内容详情
替代品

模型简介

该模型是wav2vec2-base的微调版本,专注于语音识别任务,适用于将语音转换为文本的应用场景

模型特点

低词错误率
在评估集上取得了31.42%的词错误率,表现良好
基于wav2vec2-base微调
基于成熟的wav2vec2-base架构进行优化
高效训练
使用混合精度训练和线性学习率调度器优化训练过程

模型能力

语音识别
音频转文本

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
准确率约68.58% (基于31.42% WER)
字幕生成
为视频内容自动生成字幕