W

Wav2vec2 Luganda

由 indonesian-nlp 开发
基于Facebook的wav2vec2-large-xlsr-53模型微调而成的卢干达语自动语音识别系统,在Common Voice卢干达语数据集上取得7.53%的WER。
下载量 52
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

专为卢干达语设计的自动语音识别模型,适用于将卢干达语语音转换为文本。

模型特点

高准确率
在Common Voice卢干达语测试集上达到7.53%的词错误率(WER)
基于强大基础模型
基于Facebook的wav2vec2-large-xlsr-53模型微调,继承了其优秀的语音特征提取能力
支持KenLM语言模型
可结合KenLM语言模型进一步提升识别准确率

模型能力

卢干达语语音识别
16kHz音频处理
批量语音转文本

使用案例

语音转写
卢干达语语音转录
将卢干达语语音内容转换为文本
7.53%的词错误率
语音助手
卢干达语语音交互
为卢干达语语音助手提供语音识别能力