W

Wav2vec2 Xls R Pa IN A1

由 DrishtiSharma 开发
基于Facebook的wav2vec2-xls-r-300m模型在Common Voice 8.0旁遮普语(印度)数据集上微调的自动语音识别模型
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于旁遮普语(印度方言)的语音识别任务,能够将语音转换为文本

模型特点

高精度识别
在评估集上达到0.4908的词错误率(WER)
大规模预训练
基于Facebook的wav2vec2-xls-r-300m模型微调,具有强大的语音特征提取能力
特定语言优化
专门针对旁遮普语(印度方言)进行优化训练

模型能力

语音转文本
旁遮普语(印度)语音识别
实时语音处理

使用案例

语音转写
语音备忘录转录
将旁遮普语(印度)的语音备忘录转换为可搜索的文本
准确率约51% (WER 0.4908)
辅助技术
语音控制应用
为旁遮普语用户开发的语音控制界面