W

Wav2vec2 Large Xls R 300m Assamese Cv8

由 infinitejoy 开发
这是一个基于facebook/wav2vec2-xls-r-300m模型在阿萨姆语数据集上微调的自动语音识别(ASR)模型
下载量 18
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS数据集上微调的版本,专门用于阿萨姆语的语音识别任务

模型特点

阿萨姆语专用
专门针对阿萨姆语优化的语音识别模型
基于XLS-R架构
采用facebook的XLS-R-300M大规模预训练模型作为基础
Common Voice数据集微调
使用Mozilla Common Voice 8.0的阿萨姆语数据集进行微调

模型能力

阿萨姆语语音识别
语音转文本
对话语音处理

使用案例

语音转写
阿萨姆语语音转录
将阿萨姆语语音内容转换为文本
在测试集上WER为65.966,CER为22.188
语音助手
阿萨姆语语音交互
支持阿萨姆语语音指令识别