W

Wav2vec2 Large Xlsr Galician

由 ifrz 开发
针对加利西亚语优化的自动语音识别模型,基于wav2vec2-large-xlsr-53微调,WER指标7.12
下载量 9,330
发布时间 : 4/29/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门用于加利西亚语语音识别的微调模型,基于Facebook的wav2vec2-large-xlsr-53架构,在OpenSLR和Common Voice数据集上进行了优化训练。

模型特点

低词错误率
在测试集上达到7.12%的词错误率(WER),表现优异
多数据集训练
结合OpenSLR和Mozilla Common Voice两个高质量数据集进行微调
基于XLSR架构
利用跨语言语音表示学习(XLSR)的强大基础模型进行优化

模型能力

加利西亚语语音识别
音频转文本
16kHz单声道音频处理

使用案例

语音转录
加利西亚语语音转文字
将加利西亚语语音内容转换为准确文本
7.12%词错误率
语音助手
加利西亚语语音指令识别
用于加利西亚语语音助手系统的语音指令理解