X

Xls R 300m Es

由 polodealvarado 开发
基于西班牙语Common Voice数据集微调的语音识别模型,采用facebook/wav2vec2-xls-r-300m架构,在测试集上WER达到14.6%
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对西班牙语优化的自动语音识别(ASR)模型,通过微调XLS-R-300M预训练模型实现,适用于西班牙语语音转文本任务。

模型特点

高性能西班牙语识别
在Common Voice 8.0西班牙语测试集上达到14.6%的WER指标
支持5-gram语言模型
内置n-gram(n=5)语言模型支持,可将WER进一步降低至10.9%
优化的训练配置
采用线性学习率调度和混合精度训练,经过13轮优化训练

模型能力

西班牙语语音识别
实时语音转文本
长音频处理

使用案例

语音转录
西班牙语会议记录
将西班牙语会议录音自动转换为文字记录
准确率达85.4% (WER 14.6)
语音助手开发
用于开发西班牙语语音助手和对话系统
语音分析
语音内容分析
分析西班牙语语音内容进行情感分析或关键词提取