W

Wavlm Base En

由 anjulRajendraSharma 开发
基于microsoft/wavlm-base微调的英语自动语音识别(ASR)模型,在english_ASR - CLEAN数据集上训练,词错误率(WER)为0.0773。
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是专门针对英语语音识别任务优化的WavLM基础模型,适用于高精度的英语语音转文字应用。

模型特点

低词错误率
在评估集上达到0.0773的词错误率(WER),表现优异
基于WavLM架构
基于微软WavLM-base模型微调,继承了其强大的语音表示能力
优化训练
采用精心调优的训练参数和线性学习率调度策略

模型能力

英语语音识别
高精度语音转文字

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
高准确率的转录结果
字幕生成
为英语视频内容自动生成字幕
语音助手
语音指令识别
识别和理解英语语音命令