W

Wav2vec2 Xlsr Punjabi

由 gagan3012 开发
基于facebook/wav2vec2-large-xlsr-53模型,使用通用语音数据集对旁遮普语进行微调的自动语音识别模型
下载量 2,433
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对旁遮普语优化的自动语音识别模型,能够将旁遮普语音频转换为文本。

模型特点

高精度旁遮普语识别
专门针对旁遮普语优化的语音识别能力
基于XLSR大模型
基于强大的wav2vec2-large-xlsr-53模型微调
16kHz采样率支持
支持标准16kHz采样率的音频输入

模型能力

旁遮普语语音识别
音频转文本
自动语音识别

使用案例

语音转录
旁遮普语语音转文字
将旁遮普语语音内容转换为可编辑的文本
词错误率58.06%
语音助手
旁遮普语语音交互
为旁遮普语用户提供语音交互能力