wav2vec2-large-xls-r-300m-assamese-cv8开源模型 - 免费实现阿萨姆语语音自动识别

Wav2vec2 Large Xls R 300m Assamese Cv8

由 infinitejoy 开发

这是一个基于facebook/wav2vec2-xls-r-300m模型在阿萨姆语数据集上微调的自动语音识别(ASR)模型

下载量 18

发布时间 : 3/2/2022

模型简介

该模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS数据集上微调的版本，专门用于阿萨姆语的语音识别任务

阿萨姆语专用

专门针对阿萨姆语优化的语音识别模型

基于XLS-R架构

采用facebook的XLS-R-300M大规模预训练模型作为基础

Common Voice数据集微调

使用Mozilla Common Voice 8.0的阿萨姆语数据集进行微调

阿萨姆语语音识别

语音转文本

对话语音处理

语音转写

阿萨姆语语音转录

将阿萨姆语语音内容转换为文本

在测试集上WER为65.966，CER为22.188

语音助手

阿萨姆语语音交互

支持阿萨姆语语音指令识别

属性	详情
模型类型	XLS-R-300M - 阿萨姆语
训练数据集	mozilla-foundation/common_voice_8_0
标签	as、自动语音识别、由训练器生成、hf-asr-leaderboard、对话模型、mozilla-foundation/common_voice_8_0、鲁棒语音事件
许可证	Apache-2.0

任务	数据集	指标	值
自动语音识别	Common Voice 8（MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS）	测试词错误率（Test WER）	65.966
自动语音识别	Common Voice 8（MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS）	测试字符错误率（Test CER）	22.188