wav2vec2-large-xls-r-1B-common_voice7-lt-ft开源语音识别模型

Wav2vec2 Large Xls R 1B Common Voice7 Lt Ft

由 reach-vb 开发

基于facebook/wav2vec2-xls-r-1b在通用语音数据集上微调的语音识别模型

下载量 20

发布时间 : 3/2/2022

模型简介

该模型是wav2vec2-xls-r-1b的微调版本，专注于语音识别任务，在评估集上表现出色

大规模预训练模型微调

基于10亿参数的wav2vec2-xls-r-1b模型进行微调，具备强大的语音特征提取能力

低词错误率

在评估集上取得了1.0的词错误率(WER)，表现优异

高效训练

采用混合精度训练和梯度累积等技术优化训练效率

语音转文本

自动语音识别

语音转录

语音转文字服务

将语音内容转换为文字记录

高准确率的转录结果

辅助技术

语音控制界面

为残障人士提供语音控制功能