W

Wav2vec2 Large Xlsr 53 Punjabi

由 kingabzpro 开发
这是一个基于Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10在Common Voice数据集上微调的旁遮普语自动语音识别模型
下载量 189
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于旁遮普语的自动语音识别任务,能够将旁遮普语语音转换为文本

模型特点

高精度语音识别
在Common Voice pa-IN测试集上取得了36.02的WER和12.81的CER
基于大模型微调
基于Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10模型微调,继承了强大的语音特征提取能力
支持语言模型集成
支持与语言模型结合使用,提高识别准确率

模型能力

旁遮普语语音识别
语音转文本
支持16kHz采样率音频处理

使用案例

语音转录
旁遮普语语音转录
将旁遮普语语音内容转换为文本
在测试集上达到36.02 WER
语音助手
旁遮普语语音助手
用于开发支持旁遮普语的语音助手应用