W

Wav2vec2 Xls R 300m Kk N2

由 DrishtiSharma 开发
这是一个基于facebook/wav2vec2-xls-r-300m模型在哈萨克语(KK)语音数据集上微调的自动语音识别(ASR)模型。
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于哈萨克语的语音识别任务,在Common Voice 8数据集上进行了微调,能够将哈萨克语语音转换为文本。

模型特点

哈萨克语优化
专门针对哈萨克语语音识别进行了微调优化
基于大规模预训练模型
基于facebook的wav2vec2-xls-r-300m模型进行微调,继承了其强大的语音特征提取能力
中等规模模型
300M参数的规模在准确率和计算效率之间取得了良好平衡

模型能力

哈萨克语语音识别
语音转文本
自动语音识别

使用案例

语音转录
哈萨克语语音转录
将哈萨克语语音内容转换为文本格式
在Common Voice 8测试集上WER为0.4355
语音助手
哈萨克语语音指令识别
用于哈萨克语语音助手中的语音指令识别