W

Wav2vec2 Large Xlsr 53 Es

由 pcuenq 开发
基于Facebook的wav2vec2-large-xlsr-53模型,在西班牙语Common Voice数据集上微调的语音识别模型,测试WER为10.50%。
下载量 147
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对西班牙语优化的自动语音识别(ASR)模型,能够将西班牙语语音转换为文本。

模型特点

低词错误率
在Common Voice西班牙语测试集上达到10.50%的WER
保留变音符号
保留了西班牙语中的变音符号,确保语义准确性
无需语言模型
可直接使用,无需额外语言模型支持
多阶段训练
采用分阶段训练策略,逐步优化模型性能

模型能力

西班牙语语音识别
16kHz音频处理
批量语音转文本

使用案例

语音转录
西班牙语语音转文字
将西班牙语语音内容转换为文本格式
准确率约89.5% (WER 10.5%)
语音助手
西班牙语语音指令识别
用于西班牙语语音助手的基础识别组件