W

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

由 carlosdanielhernandezmena 开发
适用于西班牙语自动语音识别的声学模型,基于facebook/wav2vec2-large-xlsr-53微调5个周期,使用约944小时西班牙语数据。
下载量 111
发布时间 : 12/1/2022
模型介绍
内容详情
替代品

模型简介

该模型是专门为西班牙语语音识别设计的声学模型,通过在大规模西班牙语数据集上微调得到,适用于多种西班牙语语音识别场景。

模型特点

多数据集训练
使用了来自CIEMPIESS-UNAM项目和其他公共存储库的约944小时西班牙语数据进行训练
低WER
在多个测试集上表现出色,如Mozilla Common Voice 10.0测试集WER为9.20%
方言覆盖
训练数据包含多种西班牙语方言,如墨西哥、智利、哥伦比亚、秘鲁、阿根廷和波多黎各等地的西班牙语

模型能力

西班牙语语音识别
多种方言识别
高精度转录

使用案例

语音转录
广播新闻转录
用于转录西班牙语广播新闻内容
在HUB4NE测试集上WER为7.48%
电话语音转录
用于转录电话对话内容
在CALLHOME测试集上WER为39.12%
语音助手
西班牙语语音指令识别
用于西班牙语语音助手中的指令识别