wav2vec2-large-xlsr-53-amharic开源语音识别模型

首页

Wav2vec2 Large Xlsr 53 Amharic

由 agkphysics 开发

该模型是在facebook/wav2vec2-large-xlsr-53基础上，使用阿姆哈拉语语音语料库进行微调的自动语音识别(ASR)模型。

语音识别

Transformers

其他开源协议:MIT #阿姆哈拉语语音识别 #低词错误率(26%)#非洲语言支持

下载量 2,539

发布时间 : 5/18/2023

模型简介

用于阿姆哈拉语的自动语音识别任务，在朗读语音数据上表现良好。

模型特点

高精度阿姆哈拉语识别

在验证集上达到26%的词错误率和7%的字符错误率

基于XLSR-53微调

在强大的多语言预训练模型基础上进行领域适配

开源许可

采用MIT许可证，允许自由使用和修改

模型能力

阿姆哈拉语语音识别

音频转文本

朗读语音处理

使用案例

语音转录

阿姆哈拉语语音转文字

将阿姆哈拉语语音内容转换为文字

在朗读语音上达到26% WER

语言处理

阿姆哈拉语语音助手

构建支持阿姆哈拉语的语音交互系统

属性	详情
模型类型	基于微调 Wav2vec2 XLSR - 53 的阿姆哈拉语自动语音识别模型
训练数据	阿姆哈拉语语音语料库
指标	单词错误率（WER）、字符错误率（CER）
任务类型	自动语音识别

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Wav2vec2 Large Xlsr 53 Amharic

模型简介

模型特点

模型能力

使用案例

🚀 基于微调Wav2vec2 XLSR - 53的阿姆哈拉语自动语音识别

🚀 快速开始

📚 详细文档

📄 许可证