S

Swahili Xlsr

由 Akashpb13 开发
基于facebook/wav2vec2-xls-r-300m微调的斯瓦希里语自动语音识别模型,在Common Voice 8数据集上训练
下载量 26
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对斯瓦希里语优化的自动语音识别(ASR)模型,基于XLS-R架构微调,适用于语音转文本任务

模型特点

多语言支持
基于XLS-R架构,具备处理多种语言的能力
高性能指标
在Common Voice 8测试集上达到11.76% WER和2.88% CER
鲁棒性训练
训练数据经过严格筛选,仅使用支持票数高于反对票数的样本

模型能力

语音转文本
斯瓦希里语识别
多语言语音处理

使用案例

语音转录
斯瓦希里语语音转录
将斯瓦希里语语音内容转换为文本
测试WER 0.1176,CER 0.0288
语音助手
斯瓦希里语语音命令识别
用于东非地区语音助手应用的命令识别