W

Wav2vec2 Large Xls R 300m Kk With LM

由 DrishtiSharma 开发
该模型是基于facebook/wav2vec2-xls-r-300m在哈萨克语(KK)数据集上微调的自动语音识别(ASR)模型,支持语言模型(LM)增强
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对哈萨克语优化的自动语音识别模型,在Common Voice 8.0数据集上训练,可用于将哈萨克语语音转换为文本

模型特点

语言模型增强
模型结合了语言模型(LM)进行后处理,提高了识别准确率
多数据集评估
在Common Voice和鲁棒语音事件等多个数据集上进行评估
大规模预训练
基于300M参数的wav2vec2-XLS-R模型微调,具有强大的语音特征提取能力

模型能力

哈萨克语语音识别
语音转文本
支持语言模型后处理

使用案例

语音转录
哈萨克语语音转录
将哈萨克语语音内容转换为文本
在Common Voice 8.0测试集上WER为41.7%
语音助手
哈萨克语语音指令识别
用于哈萨克语语音助手或控制系统的语音指令识别