A

Asr Wav2vec2 Dvoice Wolof

由 speechbrain 开发
这是一个针对沃洛夫语的自动语音识别模型,基于wav2vec 2.0架构,在DVoice数据集上训练,支持沃洛夫语语音转录。
下载量 44
发布时间 : 6/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的自动语音识别系统,结合了预训练的wav2vec 2.0模型和CTC/Attention机制,专门用于沃洛夫语的语音识别任务。

模型特点

预训练模型微调
基于facebook/wav2vec2-large-xlsr-53预训练模型进行微调,充分利用大规模预训练的优势
端到端解决方案
提供从音频输入到文本输出的完整流程,包括音频预处理和转录
低资源语言支持
专门针对沃洛夫语这类低资源语言优化,有助于促进非洲语言技术的发展

模型能力

沃洛夫语语音识别
音频文件转录
实时语音转文本

使用案例

语音转录
沃洛夫语语音转录
将沃洛夫语语音内容转换为文本
验证集CER 4.81%,WER 16.25%
语言技术开发
非洲语言技术研究
为非洲低资源语言提供语音技术研究基础