W

Wav2vec2 Large Xlsr 53 Spanish With Lm

由 patrickvonplaten 开发
这是一个基于Wav2Vec2-Large-XLSR-53的西班牙语语音识别模型,增加了语言模型支持,显著提升了识别准确率。
下载量 2,198
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是jonatasgrosman/wav2vec2-large-xlsr-53-spanish的改进版本,通过集成语言模型支持,提高了西班牙语语音识别的准确率。

模型特点

语言模型集成
通过pyctcdecode库集成语言模型,显著提升识别准确率
性能提升
相比原模型,在西班牙语Common Voice测试集上WER降低20%
易用性
提供与Transformers无缝集成的处理器,使用方式与原模型基本一致

模型能力

西班牙语语音识别
音频转文本
大规模语音处理

使用案例

语音转写
西班牙语语音转录
将西班牙语语音内容转换为文本
在Common Voice测试集上达到8.44% WER
语音助手
西班牙语语音指令识别
用于西班牙语语音助手的前端语音识别