W

Wav2vec2 Large Xlsr 53 Persian

由 jonatasgrosman 开发
针对波斯语优化的XLSR-53大模型语音识别系统,基于facebook/wav2vec2-large-xlsr-53架构微调
下载量 257.76k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

本模型是基于XLSR-53架构优化的波斯语语音识别系统,使用通用语音6.1波斯语数据集训练,适用于波斯语语音转文本任务。

模型特点

高性能波斯语识别
在通用语音波斯语测试集上达到30.12%的词错误率和7.37%的字错误率
基于XLSR-53架构
利用大规模自监督预训练的XLSR-53模型进行微调
16kHz采样率支持
专为16kHz采样率的语音输入优化

模型能力

波斯语语音识别
语音转文本
音频转录

使用案例

语音转录
波斯语语音转文本
将波斯语语音内容转换为文本格式
在通用语音测试集上达到30.12%的词错误率
语音助手
波斯语语音指令识别
用于波斯语语音助手的语音指令理解