W

Wav2vec2 Large Xlsr Gl

由 diego-fustes 开发
基于Facebook的wav2vec2-large-xlsr-53模型微调的加利西亚语自动语音识别(ASR)模型,在OpenSLR 77数据集上达到16.79%的WER
下载量 2,264
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门针对加利西亚语优化的自动语音识别模型,能够将加利西亚语语音转换为文本。

模型特点

高精度语音识别
在加利西亚语测试集上达到16.79%的词错误率(WER)
基于大规模预训练模型
基于Facebook的wav2vec2-large-xlsr-53模型微调,继承了强大的语音特征提取能力
16kHz采样率支持
专门优化用于处理16kHz采样率的语音输入

模型能力

加利西亚语语音识别
语音转文本
自动语音识别

使用案例

语音转录
加利西亚语语音转录
将加利西亚语语音内容转换为文本格式
16.79% WER
语音助手
加利西亚语语音指令识别
用于加利西亚语语音助手或智能家居设备的语音指令识别