A

Asr Whisper Large V2 Commonvoice Fa

由 speechbrain 开发
这是一个基于whisper-large-v2架构的自动语音识别模型,专门针对波斯语在CommonVoice数据集上进行了微调。
下载量 103
发布时间 : 1/30/2023
模型介绍
内容详情
替代品

模型简介

该模型用于波斯语的自动语音识别任务,采用whisper编码器-解码器架构,在CommonVoice波斯语数据集上微调获得。

模型特点

高性能波斯语识别
在CommonVoice波斯语测试集上达到31.75%的词错误率(WER)和9.38%的字符错误率(CER)
基于预训练模型
使用预训练的whisper-large-v2模型作为基础,编码器部分保持冻结
端到端训练
整个系统采用端到端方式训练,简化了语音识别流程

模型能力

波斯语语音识别
16kHz音频处理
自动音频标准化

使用案例

语音转写
波斯语语音转录
将波斯语语音内容转换为文本
在测试集上达到31.75%的词错误率