W

Wav2vec2 Large Xlsr Persian V2

由 m3hrdadfi 开发
基于facebook/wav2vec2-large-xlsr-53在波斯语(波斯语)上使用Common Voice数据集进行微调的自动语音识别模型
下载量 47
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于波斯语自动语音识别(ASR)的模型,基于Facebook的wav2vec2-large-xlsr-53架构微调而成,支持16kHz采样率的语音输入。

模型特点

波斯语优化
专门针对波斯语进行微调,包含波斯语字符处理和标准化
基于Common Voice数据集
使用Common Voice波斯语数据集进行训练和验证
无需语言模型
可以直接使用,不需要额外的语言模型

模型能力

波斯语语音识别
16kHz语音处理

使用案例

语音转文字
波斯语语音转录
将波斯语语音转换为文字
测试WER为31.92%