W

Wav2vec2 Large Xlsr Kazakh

由 aismlv 开发
这是一个基于facebook/wav2vec2-large-xlsr-53微调的哈萨克语自动语音识别(ASR)模型,在哈萨克语音语料库v1.1上训练,测试WER为19.65%。
下载量 12.08k
发布时间 : 3/2/2022

模型简介

该模型专门用于哈萨克语的自动语音识别任务,支持16kHz采样率的语音输入。

模型特点

高精度哈萨克语识别
在哈萨克语音语料库v1.1上达到19.65%的词错误率(WER)
基于XLSR-53架构
利用大规模跨语言语音表示学习模型进行微调
无需语言模型
可以直接使用,不需要额外的语言模型支持

模型能力

哈萨克语语音识别
16kHz音频处理

使用案例

语音转文字
哈萨克语语音转录
将哈萨克语语音内容转换为文字
词错误率19.65%
语音助手
哈萨克语语音指令识别
用于哈萨克语语音助手系统中的指令识别
AIbase
智启未来,您的人工智能解决方案智库
简体中文