V

Vakyansh Wav2vec2 Punjabi Pam 10

由 Harveenchadha 开发
基于CLSRIL-23多语言预训练模型微调的旁遮普语自动语音识别模型,支持16kHz采样率的语音输入。
下载量 96
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对旁遮普语优化的自动语音识别系统,基于Wav2Vec2架构,适用于将旁遮普语语音转换为文本。

模型特点

多语言预训练基础
基于CLSRIL-23多语言预训练模型进行微调,具有强大的语音特征提取能力。
旁遮普语优化
专门针对旁遮普语进行优化,适合该语言的语音识别任务。
无语言模型支持
当前结果未使用语言模型,未来可通过添加语言模型进一步提高识别准确率。

模型能力

旁遮普语语音识别
16kHz采样率语音处理

使用案例

语音转文字
旁遮普语语音转录
将旁遮普语语音内容转换为文本格式
词错误率(WER)33.17