A

Asr Wav2vec2 Commonvoice En

由 speechbrain 开发
这是一个基于CommonVoice英语数据集训练的端到端自动语音识别系统,结合了wav2vec 2.0预训练模型和CTC解码器。
下载量 681
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于英语语音识别任务,采用wav2vec 2.0作为声学特征提取器,并结合CTC解码器进行端到端训练。

模型特点

端到端语音识别
结合wav2vec 2.0预训练模型和CTC解码器,实现完整的语音识别流程
无语言模型依赖
系统不依赖外部语言模型,简化了部署流程
自动音频预处理
内置音频标准化处理,包括重采样和单声道选择

模型能力

英语语音识别
音频转录
批量语音处理

使用案例

语音转录
会议记录自动转录
将英语会议录音自动转换为文字记录
词错误率15.69%(在CommonVoice测试集上)
语音笔记转换
将语音备忘录转换为可编辑文本