W

Wavlm Libri Clean 100h Base

由 patrickvonplaten 开发
基于microsoft/wavlm-base在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
下载量 6,515
发布时间 : 3/2/2022

模型简介

该模型是针对英语语音识别任务优化的WavLM基础版本,在100小时干净语音数据上进行了微调,具有较低的词错误率。

模型特点

高效微调
在100小时干净语音数据上进行微调,显著提升了基础模型的识别准确率
低词错误率
在评估集上取得了0.0675的词错误率(WER),表现优异
多GPU训练
采用8个GPU进行分布式训练,提高了训练效率

模型能力

英语语音识别
连续语音转文本
高准确率转录

使用案例

语音转录
会议记录自动生成
将会议录音自动转换为文字记录
准确率约93.25%(基于WER 0.0675计算)
播客内容索引
为音频播客节目生成可搜索的文字内容
辅助技术
实时字幕生成
为视频或直播内容提供实时字幕
AIbase
智启未来,您的人工智能解决方案智库
简体中文