A

Asr Wav2vec2 Commonvoice Rw

由 speechbrain 开发
这是一个用于卢旺达语自动语音识别的端到端模型,基于wav2vec 2.0预训练模型结合CTC和注意力机制,在CommonVoice数据集上微调。
下载量 28
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型提供卢旺达语的自动语音识别功能,包含分词器和声学模型两个模块,支持16kHz采样率的音频输入。

模型特点

端到端语音识别
提供从音频输入到文本输出的完整处理流程
预训练模型微调
基于wav2vec2-large-xlsr-53预训练模型在卢旺达语数据上微调
双解码机制
同时使用CTC和注意力机制进行解码,提高识别准确性
自动音频处理
内置音频标准化功能,自动处理采样率和声道转换

模型能力

卢旺达语语音识别
音频转录
批量语音处理

使用案例

语音转录
语音转文字
将卢旺达语语音内容转换为文本
词错误率18.91%
语音助手
卢旺达语语音交互
为卢旺达语语音助手提供识别能力