W

Wav2vec2 Large Xls R 300m Spanish Small

由 glob-asr 开发
这是一个基于wav2vec2架构的西班牙语语音识别模型,在通用语音数据集上进行了微调,词错误率(WER)为0.2105。
下载量 58
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是对jhonparra18/wav2vec2-large-xls-r-300m-spanish-custom的微调版本,专门用于西班牙语语音识别任务。

模型特点

高效语音识别
在西班牙语语音识别任务上表现优异,词错误率仅为0.2105
基于大规模预训练模型
基于wav2vec2-large-xls-r-300m架构,具有强大的语音特征提取能力
精细微调
在通用语音数据集上进行了30轮精细微调,优化了西班牙语识别性能

模型能力

西班牙语语音识别
语音转文本
连续语音识别

使用案例

语音转录
西班牙语会议记录
将西班牙语会议录音自动转换为文字记录
词错误率约21%
语音助手
为西班牙语语音助手提供语音识别能力
教育
语言学习应用
帮助学习者练习西班牙语发音和听力