A

Asr Wav2vec2 Dvoice Amharic

由 speechbrain 开发
这是一个针对阿姆哈拉语的自动语音识别模型,使用wav2vec 2.0架构和CTC/Attention机制训练
下载量 96
发布时间 : 6/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的自动语音识别系统,专门用于阿姆哈拉语的语音转录任务。它结合了预训练的wav2vec 2.0模型和CTC解码器,在DVoice阿姆哈拉语数据集上进行了微调。

模型特点

预训练模型微调
基于facebook/wav2vec2-large-xlsr-53预训练模型进行微调,提高了对阿姆哈拉语的识别能力
端到端系统
提供完整的端到端解决方案,包括分词器和声学模型
多平台支持
支持CPU和GPU推理,可灵活部署在不同硬件环境

模型能力

阿姆哈拉语语音识别
音频转录
语音转文本

使用案例

语音转录
阿姆哈拉语语音转录
将阿姆哈拉语语音转换为文本
验证集CER 6.71%,WER 25.50%
语音助手
阿姆哈拉语语音助手
构建支持阿姆哈拉语的语音交互系统