W

Wav2vec2 Large Xlsr 53 Amharic

由 agkphysics 开发
该模型是在facebook/wav2vec2-large-xlsr-53基础上,使用阿姆哈拉语语音语料库进行微调的自动语音识别(ASR)模型。
下载量 2,539
发布时间 : 5/18/2023
模型介绍
内容详情
替代品

模型简介

用于阿姆哈拉语的自动语音识别任务,在朗读语音数据上表现良好。

模型特点

高精度阿姆哈拉语识别
在验证集上达到26%的词错误率和7%的字符错误率
基于XLSR-53微调
在强大的多语言预训练模型基础上进行领域适配
开源许可
采用MIT许可证,允许自由使用和修改

模型能力

阿姆哈拉语语音识别
音频转文本
朗读语音处理

使用案例

语音转录
阿姆哈拉语语音转文字
将阿姆哈拉语语音内容转换为文字
在朗读语音上达到26% WER
语言处理
阿姆哈拉语语音助手
构建支持阿姆哈拉语的语音交互系统