wav2vec2-xls-r-pa-IN-a1开源自动语音识别模型 - 精准识别旁遮普语(印度)语音

Wav2vec2 Xls R Pa IN A1

由 DrishtiSharma 开发

基于Facebook的wav2vec2-xls-r-300m模型在Common Voice 8.0旁遮普语(印度)数据集上微调的自动语音识别模型

下载量 20

发布时间 : 3/2/2022

模型简介

该模型专门用于旁遮普语(印度方言)的语音识别任务，能够将语音转换为文本

高精度识别

在评估集上达到0.4908的词错误率(WER)

大规模预训练

基于Facebook的wav2vec2-xls-r-300m模型微调，具有强大的语音特征提取能力

特定语言优化

专门针对旁遮普语(印度方言)进行优化训练

语音转文本

旁遮普语(印度)语音识别

实时语音处理

语音转写

语音备忘录转录

将旁遮普语(印度)的语音备忘录转换为可搜索的文本

准确率约51% (WER 0.4908)

辅助技术

语音控制应用

为旁遮普语用户开发的语音控制界面

属性	详情
模型类型	基于 facebook/wav2vec2-xls-r-300m 微调的自动语音识别模型
训练数据	MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - PA - IN 数据集
许可证	Apache - 2.0