W

Wav2vec2 Large English

由 jonatasgrosman 开发
基于facebook/wav2vec2-large在英语上进行了微调的自动语音识别模型,使用Common Voice 6.1数据集训练
下载量 355
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

针对英语语音识别任务优化的wav2vec2大型模型,支持16kHz采样率的语音输入

模型特点

高性能英语识别
在Common Voice英语测试集上达到21.53% WER和9.66% CER
基于大型预训练模型
基于facebook/wav2vec2-large模型微调,具有强大的语音特征提取能力
16kHz采样率支持
专为16kHz采样率的语音输入优化

模型能力

英语语音识别
音频转文本
自动语音转录

使用案例

语音转录
会议记录自动转录
将英语会议录音自动转换为文字记录
准确率约80% (基于WER指标)
播客内容转录
将英语播客节目自动转换为文字内容
语音助手
英语语音指令识别
用于智能设备的英语语音指令识别系统