W

WHISPER SMALL SWAHILI ASR CV 14

由 dmusingu 开发
该模型是基于OpenAI的Whisper large在Common Voice 14.0斯瓦希里语(SW)数据集上微调的语音识别模型,词错误率(WER)为25.13%。
下载量 28
发布时间 : 4/19/2024
模型介绍
内容详情
替代品

模型简介

一个针对斯瓦希里语优化的自动语音识别(ASR)模型,基于Whisper架构进行微调,适用于语音转文本任务。

模型特点

低词错误率
在Common Voice 14.0斯瓦希里语测试集上达到25.13%的词错误率(WER)
基于Whisper架构
基于OpenAI强大的Whisper-large模型进行微调,继承了其优秀的语音识别能力
专门针对斯瓦希里语优化
在Common Voice 14.0的斯瓦希里语数据集上进行训练,对该语言有更好的识别效果

模型能力

语音转文本
斯瓦希里语语音识别
长音频处理

使用案例

语音转录
斯瓦希里语语音转录
将斯瓦希里语语音内容转换为文本
词错误率25.13%,字错误率9.83%
语音助手
斯瓦希里语语音助手
为斯瓦希里语用户提供语音交互能力