W

Wav2vec2 Large Xlsr Persian V3

由 m3hrdadfi 开发
基于Facebook的wav2vec2-large-xlsr-53模型在波斯语通用语音库上微调的自动语音识别(ASR)模型
下载量 1,888
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于波斯语(法尔西)的语音识别任务,通过XLSR架构的大规模预训练和波斯语数据微调实现高准确率转录。

模型特点

低词错误率
在波斯语测试集上达到10.36%的WER(词错误率)
大规模预训练
基于facebook/wav2vec2-large-xlsr-53的跨语言预训练模型
专业数据微调
使用通用语音库波斯语版数据进行针对性微调

模型能力

波斯语语音识别
16kHz音频处理
长语音转录

使用案例

语音转写
波斯语语音转录
将波斯语语音内容转换为文字
准确率约90%(WER 10.36%)
语音助手
波斯语语音指令识别
为波斯语语音助手提供核心识别能力