X

Xlsr English

由 ashesicsis1 开发
基于facebook/wav2vec2-xls-r-300m在librispeech_asr数据集上微调的英语语音识别模型
下载量 18
发布时间 : 5/29/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对英语语音识别任务优化的XLS-R架构模型,在LibriSpeech数据集上取得了较低的词错误率

模型特点

低词错误率
在评估集上达到0.1451的词错误率,表现优异
基于XLS-R架构
采用facebook的wav2vec2-xls-r-300m预训练模型作为基础
精细调优
经过30轮训练和线性学习率调度优化

模型能力

英语语音识别
音频转文本
大规模语音数据处理

使用案例

语音转录
有声书转录
将英语有声读物自动转换为文本
高准确率的转录结果
会议记录
自动生成英语会议的文本记录
辅助技术
听力辅助
为听障人士提供实时语音转文字服务